Sunday, February 17, 2019

IOT Analitik Big Data Untuk Smart Home Dengan Fog Dan Cloud Computing

ABSTRAK
Internet of Things (IoT) analytics adalah sarana penting untuk menurunkan pengetahuan dan mendukung aplikasi untuk smart home. Perangkat dan perangkat yang terhubung di dalam smart home menghasilkan jumlah yang signifikan data tentang konsumen dan bagaimana mereka melakukan kegiatan sehari-hari mereka. Analitik IoT dapat membantu dalam personalisasi aplikasi yang bermanfaat bagi pemilik rumah dan industri yang terus bertumbuh yang perlu disentuh profil konsumen. Artikel ini menyajikan platform baru yang memungkinkan analisis inovatif pada IoT ditangkap data dari smart home. Kami mengusulkan penggunaan node fog dan sistem cloud untuk memungkinkan layanan data-driven dan mengatasi tantangan kompleksitas dan kebutuhan sumber daya untuk pemrosesan data online dan offline,

penyimpanan, dan analisis klasifikasi. Kami membahas dalam makalah ini persyaratan dan komponen desain dari sistem. Untuk memvalidasi platform dan menyajikan hasil yang berarti, kami menyajikan studi kasus menggunakan dataset yang diperoleh dari smart home asli di Vancouver, Kanada. Hasil eksperimen menunjukkan dengan jelas manfaat dan kepraktisan platform yang diusulkan.

PENGANTAR
Smart Home adalah tema kehidupan masa depan. Banyak komunitas di seluruh dunia saat ini menyebarkan Smart Home sebagai bagian dari inisiatif modernisasi. Rumah-rumah ini selalu aktif sejumlah besar data berharga dari perangkat pintar dan peralatan yang terhubung ke sistem IoT [1]. Kemampuan untuk menganalisis data ini mendekati real-time dan off-line memungkinkan untuk penemuan berbagai informasi yang memiliki dampak signifikan terhadap masyarakat kita keselamatan, kesehatan, dan ekonomi. Misalnya, kesehatan kota yang cerdas sistem perawatan dapat menentukan status pasien di dalam Smart Home dengan memantau penggunaan peralatan dan mendeteksi mereka
kegiatan rutin atau tidak normal yang dapat menunjukkan tanda-tanda kesehatan masalah. . Perusahaan utilitas dapat menganalisis sejumlah besar data konsumsi energi dari peralatan di dalam rumah untuk belajar tentang perilaku penghuni dan merekomendasikan tagihan listrik

Rencana pengurangan untuk konsumen berdasarkan profil penggunaan energi . Skenario seperti itu menyebabkan pengurangan biaya tidak hanya untuk konsumen tetapi juga juga untuk perusahaan utilitas. Aplikasi IoT real-time memungkinkan pembuatan untuk menganalisis data secara terus menerus dan menentukan atau memprediksi suatu jadwal perawatan alat atau segera ganti kerusakan peralatan. Contoh-contoh aplikasi IoT ini mengungkapkan kelebihannya menganalisis data smart home. Sementara data-data tersebut bermanfaat peluang dalam memahami dinamika dan perilaku smart home dan penghuninya, juga merinci yang luar biasa tantangan terkait manajemen data, penyimpanan, dan analitik. Untuk memastikan bahwa pengguna tidak tenggelam dalam banjir data, mereka butuhkan sistem yang mampu mengelola, menganalisis dan mengubah ini jumlah data menjadi wawasan yang dapat ditindaklanjuti untuk aplikasi kota pintar yang menuntut tindakan cepat dengan persyaratan yang ketat. Ini sistem juga harus memenuhi kebutuhan skalabilitas dengan pertumbuhan volume data dan granularitas temporal pengambilan keputusan, apakah itu off-line atau mendekati real-time.

Untuk evaluasi sistem yang diusulkan, kami menyajikan sebuah kasus studi menganalisis dan memproses aliran data dari smart home. Smart home menghasilkan aliran besar yang terus menerus data dalam interval waktu yang singkat. Memproses dan menganalisis seperti itu data sangat penting untuk banyak aplikasi (mis., sistem perawatan kesehatan, pintar aplikasi manajemen energi grid dll). Kontribusi utama dibuat dalam makalah ini adalah sebagai berikut:
Mengusulkan platform untuk IoT analytics data smart home cerdas dengan cloud dan cloud computing. 
Menyediakan persyaratan detail dan analisis komponen desain arsitektur platform.
Menyajikan studi kasus dari smart home yang sebenarnya. Kami menganalisis data IoT smart home untuk perilaku dan prediksi analisis penghuni yang berkaitan dengan konsumsi energy rutinitas dan pola.

PEKERJAAN YANG BERHUBUNGAN
Baru-baru ini, beberapa penelitian telah mengusulkan sistem dan kerangka kerja untuk analisis data IoT menggunakan berbagai arsitektur yang terlibat fog dan cloud computing. Di bagian ini, kita membahas studi ini terutama mereka yang mewakili negara-of-the-art dan dekat dengan pekerjaan kami.
Banyak peneliti menangani masalah yang terkait erat dengan pekerjaan kami . Misalnya pekerjaan di , berfokus pada analisis prediktif untuk smart home yang membutuhkan akses ke data historis yang harus disimpan dalam database besar itu hanya dapat disediakan oleh sistem cloud. Pekerjaan  diselidiki layanan smart home untuk analisis mendalam tentang rumah alat penggunaan pola yang sering. Secara khusus, penemuan coutilization perilaku peralatan di dalam smart home. Untuk ini Tujuan penulis mengajukan penambangan pola multidimensional kerangka kerja dari sejumlah besar pengguna perumahan yang terhubung Penyedia Layanan Internet (ISP). Para penulis dalam  mengembangkan sebuah sistem gerbang baru untuk secara otomatis mengintegrasikan dan mengkonfigurasi baru perangkat IoT berbasis rumah untuk analisis tanpa batas di sistem cloud. Kerangka kerja SLASH dalam menyajikan pendekatan baru untuk pintar adaptivitas rumah dan mekanisme belajar mandiri. Ide itu termasuk pengembangan lapisan data besar  dengan mesin analitik yang mendukung perilaku penghuni. Pekerjaan dalam mengusulkan suatu sistem otomatisasi rumah end-to-end yang mendukung banyak IoT protokol untuk akuisisi dan analisis data. Para penulis mengklaim itu sistem mereka mampu menangani data yang berasal dari seluruh kota perangkat yang digunakan. Mirip dengan pekerjaan di , kota pintar umum Paradigma diusulkan dalam untuk sistem analisis big data IoT itu mengintegrasikan sensor dari smart home, lalu lintas, kendaraan, pengawasan sensor, dll. menggunakan lingkungan ekosistem nyata Hadoop.

PERSYARATAN PLATFORM
Desain platform inovatif yang cocok untuk mendukung sejumlah besar data yang dihasilkan dari smart home memiliki kekhasan persyaratan, fungsi, dan struktur desain. 
Distribusi Sumber Daya: Memproses sejumlah besar data yang dihasilkan dari peralatan rumah tangga dan perangkat membutuhkan biaya yang efektif dan sumber daya analisis data besar yang efisien lebih dekat sistem fisik.
Scalable Analytics: Aliran data dari smart home hadir prospek yang menantang untuk operasi pengolahan dan penambangan. Aliran data ini diterima di sistem dalam volume tinggi, kecepatan tinggi dan dari berbagai sumber.
Kinerja: Aliran data IoT harus ditangani secara parallel cara untuk meningkatkan kinerja analitik data dan untuk mengoptimalkan operasi smart home.
Integrasi: Pada setiap saat instan, data dikumpulkan dari perangkat yang berbeda di dalam smart home tidak terstruktur dan tidak dapat diproses menggunakan alat konvensional
Visualisasi : Persyaratan utama lain untuk menangani data IoT skala besar dari smart home, adalah relevansi data melalui visualisasi.

Untuk memenuhi persyaratan di atas, dalam tulisan ini kami menyajikan sebuah IoT platform analitik data besar untuk memproses dan menganalisis besar volume aliran data smart home. Ayat selanjutnya menjelaskan platform yang diusulkan.

KOMPONEN DESAIN PLATFORM

Gambar diatas menunjukkan arsitektur dari platform yang diusulkan. Terdiri dari IoT analitik data besar dengan node dan cloud komputasi fog sistem. Komponen platform mendukung operasi yang kompleks integrasi berkesinambungan, pemrosesan dan analitik multiple data smart home. Node fog memperluas layanan cloud sistem ke tepi jaringan dekat dengan lokasi fisik smart home, sehingga memungkinkan pemrosesan data lebih cepat dan aplikasi layanan yang hanya dapat dilayani dalam waktu tertentu. Sistem cloud mengambil proses pengangkatan yang berat aplikasi intensif komputasi.
Analitik operasi termasuk penyaringan dan pembersihan, pengelompokan dan agregasi di mana setiap operasi membutuhkan waktu lama tergantung pada sifat data. Berikut ini adalah detail dari platform tersebut,
Komponen Smart home: Smart home terdiri dari sensor, perangkat, peralatan dan sistem meteran. Komponen-komponennya dari smart home secara kasar dikategorikan ke dalam tiga tingkatan yaitu cyber-fisik, konektivitas, dan kontekstual.
Layanan Manajemen dan Integrasi IoT: Manajemen IoT layanan adalah subsistem berbasis broker yang bertanggung jawab untuk menangani permintaan layanan IoT dari banyak smart home aplikasi ke dalam sistem cloud
Fog Computing Nodes: Node fog menyediakan sumber daya tambahan dan layanan komputasi untuk mendukung berbagai pintar aplikasi yang peka waktu di rumah.
Cloud System: Di platform yang diusulkan, sistem cloud adalah bertanggung jawab untuk menyediakan layanan inti ke aplikasi smart home itu termasuk analisis data historis, penyimpanan diperpanjang kemampuan, dan infrastruktur manajemen smart home inti.

STUDI KASUS

Dalam studi kasus ini, kami melakukan analisis data IoT peralatan dan perangkat dari smart home di Vancouver, British Columbia, Kanada. Data ini tersedia untuk umum dari Harvard Education situs web. Dataset ini terdiri dari pengukuran interval satu menit beberapa peralatan smart home selama rentang dua tahun, April 2012 – April 2014. Kami melakukan analisis data Streaming IOT untuk mengungkap perilaku penghuni penggunaan alat seperti mengidentifikasi pola yang sering dikaitkan dengan peralatan termasuk jam hari, hari dalam seminggu, dan bulan tahun sebagai sarana memahami bagaimana penghuni menjalani rutinitas sehari-hari mereka. Untuk node fog di mana mesin analitis bertanggung jawab melakukan analisis langsung untuk memenuhi persyaratan aplikasi semacam itu sebagai manajemen konsumsi energi, iklan bertarget, aktivitas pengakuan. Idealnya, untuk studi kasus khusus ini dapat skalabel sumber daya komputasi diperlukan untuk meningkatkan kinerja dengan tambahan akuisisi data. Tes kami dilakukan pada node tunggal yang terdiri dari sistem komputer yang menjalankan CPU core i5 dengan 8GB RAM dan 1 TB perangkat penyimpanan. Pengolahan utama sumber daya dialokasikan ke bagian analisis tempat kami memproses 2- tahun data. Waktu berjalan saat ini memakan waktu beberapa menit dapat ditingkatkan dengan lebih banyak sumber daya komputasi, bagaimanapun, itu menunjukkan bahwa satu node fog mampu memproses lebih dari satu smart home. 

Pembersihan dan Persiapan Data: Kumpulan data berisi jutaan catatan (contoh data mentah ditunjukkan Tabel 1) dengan a sejumlah besar data tentang peralatan. Data tentang peralatan adalah dikumpulkan setiap menit selama dua tahun (April 2012– April 2014). Pengukuran data ini termasuk: stempel waktu unix, tegangan listrik, tegangan, daya semu. Proses pembersihan data dimulai dengan mengimpor file data dalam skrip Python. Itu proses pembersihan termasuk menghilangkan kolom yang tidak perlu, konversikan Stempel waktu Unix ke tanggal yang dapat dibaca manusia, hapus nilai yang ada di bawah ambang batas daya siaga, menghapus pencilan dan duplikat baris. Seluruh proses pembersihan selesai menggunakan Python dengan ekspresi reguler (RegEx).
Frequent Pattern Mining: Untuk penambangan pola yang sering, kami adalah tertarik menganalisis kejadian ketika peralatan tertentu sedang digunakan dengan memeriksa keadaan ‘‘ AKTIF / MATI ’dan energi konsumsi. Berada dalam keadaan Aktif memungkinkan untuk kesimpulan bahwa a manusia saat ini menggunakan alat tertentu. Informasi ini dapat bermanfaat dalam aplikasi tertentu, dan sebagai hasilnya, data dan pola yang ditambang memiliki nilai untuk industri. Misalnya, oleh mengetahui kapan seorang individu cenderung memiliki televisi berubah pada dapat membantu perusahaan menargetkan iklan. Kami ingin Dapatkan pola-pola ini dalam hubungan-hubungan yang bernilai tersendiri . Secara khusus, kami mempelajari pola penggunaan alat dari seluruh rumah dan mencari untuk mengungkap asosiasi dari domain waktu. Secara formal, biarkan A menjadi a database yang terdiri dari n itemsets T1 sedemikian rupa sehingga A = (T1, T2,..., Tn). Sebuah itemset dianggap sebagai pola yang sering jika muncul dengan frekuensi tertentu dalam transaksi basis data. Pengguna dapat menentukan level threshold dari penghitungan frekuensi dari suatu itemset dalam suatu transaksi. Salah satu metode untuk menentukan frekuensi hitungan dikenal sebagai hitungan dukungan yang didefinisikan sebagai perhitungan statistik frekuensi suatu itemset dalam suatu transaksi dibawa melalui database A. Sebagai contoh, dua itemsets I (I ⊆ A) dan J (J ⊆ A) dihitung sebagai pola yang sering dalam suatu transaksi jika mereka dukungan sI dan sJ berada di atas nilai ambang batas yang dikenal sebagai minimum mendukung mntup. Dalam kasus menemukan pola yang sering, maka aturan asosiasi ditentukan. Aturan asosiasi dinyatakan sebagai {I ⇒ J} dan berasal dari dukungan - kepercayaan, di mana dukung sI⇒J sedemikian rupa sehingga s (I ⇒ J) = sI⇒J = s (I ∪ J) adalah persentase dari semua transaksi yang memiliki (I ∪ J) di A. Dukungan mewakili prakondisi bersama dari asosiasi ini dalam database sementara keyakinan adalah prasyarat yang berkontribusi pada konsekuensinya. Dalam pengertian ini, frekuensi itemset dalam suatu transaksi menunjukkan signifikansi statistik dari aturan asosiasi (artinya probabilitas P (I, J)), ditentukan oleh kepercayaan (I∪J) | | s (I) | (berarti probabilitas bersyarat P (I | J)) [46,38]. Kami sering menggunakannya algoritma pola FP-Pertumbuhan [46,38] dan perluasannya [5] dalam hal ini dataset smart home. Prosedur (1) menunjukkan langkah-langkah menangkap pola-pola yang sering dari dataset. Buah ara. 4, 5, dan 6 pertunjukan pola konsumsi energi enam peralatan di rumah terdiri dari jam sehari, hari minggu, bulan tahun. Kami mendaftar ambang batas dukungan minimum 30% pada dataset dan berbalik semua nilai yang berada di bawah ambang ke 0 dan semua yang di atas hingga 1. Ini memungkinkan kita untuk mendapatkan matriks biner untuk memeriksa apa peralatan digunakan pada waktu tertentu seperti yang ditunjukkan pada Tabel 2.

Hasil akhir dari penambangan pola sering adalah asosiasi antara peralatan yang merupakan hasil dari penggunaan simultan dari alat oleh penghuni. Gambar 7 menunjukkan contoh penggunaan per jam dan penggunaan perangkat per hari dalam seminggu. Dari Gambar 7-a itu terlihat dua peralatan yang paling banyak digunakan adalah mesin pencuci piring dantelevisi antara jam 6 sore - 10: 30 sore. Untuk ketiganya peralatan (mesin pencuci piring, pengering, dan televisi) pada saat yang sama, waktu yang paling mungkin hari ini akan terjadi antara 8–8: 30 sore. Hari-hari dalam seminggu di Fig. 7-b menunjukkan hal itu sangat sering mesin pencuci piring dan televisi sering bersama di waktu yang sama. Memeriksa setiap hari secara individual, Anda dapat melihat tertentu pola seperti Senin dan Selasa malam mesin pencuci piring dan televisi berada dalam waktu paling lama atau hari Sabtu televisi dan mesin pencuci piring ada di malam hari.
Penambangan Gugus: Analisis pola yang sering dijumpai di atas wawasan tentang bagaimana penghuni smart home memanfaatkan bersama peralatan mereka. Analisis pengelompokan memungkinkan kami menginterpretasikan waktu terkait dengan kelompok peralatan. Ini agak penting untuk mengungkap perilaku lebih dalam konsumsi energi alat waktu spesifik (misalnya jam sibuk). Untuk mencapai tujuan ini, kami mengimplementasikan algoritma pengelompokan k-mean di [38]. Dasar prinsip algoritma k-mean adalah bahwa ia mendefinisikan pusat k yang ditempatkan di posisi tertentu dari satu sama lain. Kemudian, fungsi G (z) = Σk i = 1 ΣCij = 1 (∥ai - bj∥) 2 digunakan untuk menentukan nilai kesalahan kuadrat, di mana ai - bj adalah jarak Euclidean antara a dan b, Ci mewakili jumlah titik data di dalamnya gugus. Menentukan jumlah k yang optimal sangat penting untuk didapatkan hasil yang lebih baik. Ada banyak metode untuk menentukan yang ideal angka k seperti yang dijelaskan dalam [47]. Pendekatan dalam pekerjaan ini menggunakan Koefisien siluet sebagai alat penghitungan yang optimal angka k [48]. Metode ini pada dasarnya mengukur kualitas klaster dengan mengevaluasi seberapa baik titik data diposisikan dalam sebuah cluster. Ini menghitung jarak rata-rata yj yang diberikan sebagai xj = rata-rata {dis (yj, yi)} ke semua titik data lainnya di cluster Ci dan  kemudian tentukan wj = min (wj) di semua kluster kecuali Ci. Koefisien Silhouette untuk yj ditentukan sebagai ryj = (wj − xj) max (xj, wj) dan Koefisien Silhouette untuk cluster Ci dan untuk memiliki k cluster sebagai rCi = rata-rata (syj) untuk j = d1..dn dan rk = rata-rata (sCi) untuk i = 1..k masing-masing. Semakin tinggi nilai siluet rata-rata, semakin baik pengelompokan. Dengan kata lain, Silhouette rata-rata menyediakan observasi tentang berbagai nilai k ∈ 1, 2, 3. . .m, di mana m mewakili objek unik dalam kumpulan data. Untuk mencari tahu jumlah cluster optimal, proses ini terus dijalankan dan koefisien Silhouette rata-rata dihitung sampai menemukan jumlah cluster optimal yang memaksimalkan rk. Gambar 8 menunjukkan pengelompokan peralatan pada jam hari, di mana kekuatan klaster menandakan frekuensi penggunaan alat, yaitu, kekuatan yang lebih tinggi dari gugus untuk alat menunjukkan penggunaan lebih tinggi selama periode tersebut. Penggunaan lebih tinggi atau lebih rendah alat, yaitu, pola penggunaan alat bisa langsung perwakilan perilaku konsumsi energi penghuni. Seperti itu analisis dapat dilakukan pada berbagai tingkatan seperti individu rumah, kelompok rumah, komunitas atau lingkungan, atau di tingkat sistem. Ketika dilakukan pada tingkat yang lebih tinggi seperti lingkungan atau tingkat sistem, hasilnya dapat membantu profil rumah sesuai untuk perilaku konsumsi energi dan menyesuaikan respons permintaan mekanisme menjadi lebih efisien. Selanjutnya, di satu rumah, hasil dapat membantu menyesuaikan rekomendasi untuk mengurangi rumah tangga biaya energi sambil menghormati penghuni mengharapkan kenyamanan. Selain itu, layak untuk mempertimbangkan pembangkit energi terbarukan di tingkat lingkungan atau rumah untuk menyempurnakan respons permintaan program atau rekomendasi pengurangan energi.

KESIMPULAN DAN PEKERJAAN DI MASA DEPAN
Dalam tulisan ini, kami menyajikan platform untuk IoT smart home big data analytics dengan fog dan cloud computing. Kami berikan analisis kebutuhan detail dan ilustrasi komponen platform. Proses melakukan analisis di node fog disajikan, dan hasilnya menunjukkan kemungkinan penerapan sistem dalam berbagai aspek. Misalnya, aplikasi dari data yang diperoleh dapat mencakup pengakuan aktivitas untuk mengidentifikasi kesehatan masalah, identifikasi pola konsumsi energi dan penghematan energi perencanaan, dan memprediksi jadwal perawatan alat untuk dihindari perbaikan mahal dan memastikan operasi yang efisien dari titik pandangan konsumsi energi.
Secara umum, platform dapat membantu keputusan yang efektif dan tepat waktu pembuatan untuk pemilik rumah individu dengan memfasilitasi berbagai program manajemen energi di tingkat rumah. Energi rumah tangga manajemen konsumsi dan analitik data adalah operasi yang kompleks yang membutuhkan integrasi berkesinambungan dari berbagai sumber ke dalam sistem pemrosesan umum dengan akses mudah ke data. Lain aplikasi yang mungkin dapat diperpanjang untuk melayani perusahaan yang tertarik dengan iklan tertarget.
Untuk pekerjaan di masa depan, kami berencana untuk mengembangkan mekanisme pengoptimalan seperti yang ada di [49,50] untuk menentukan distribusi optimal dan konfigurasi fog saat mempertimbangkan sumber daya komputasi dan kemampuan memproses yang dibutuhkan data dari beberapa rumah. Selanjutnya, kami berencana untuk memperbaiki komponen platform dan uji dengan dataset yang berbeda dari berbagai rumah. Pendekatan ini sangat penting untuk memvalidasi penerapan dari platform dan kekuatannya dalam menangani semua jenis data IoT pengukuran. Kami juga berencana untuk mempelajari skema benchmarking menilai dan menangkap kinerja platform dan analitik di bawah berbagai masalah termasuk runtime, utilisasi CPU, data ukuran, permintaan masuk, dll.


Terimakasih telah berkomentar
EmoticonEmoticon