Metode dan perangkat untuk mendengkur, media penyimpanan, prosesor, dan proses
Aplikasi ini berkaitan dengan bidang teknologi pemrosesan informasi, dan khususnya untuk metode dan perangkat untuk mendengkur pengakuan, media penyimpanan, dan prosesor.
Teknik latar belakang:
Mendengkur adalah fenomena yang sangat umum, sekitar 20% -40% orang menderita gejala mendengkur. Mendengkur tidak hanya mengganggu pasien, memengaruhi rekan-rekan mereka, tetapi juga mengancam kesehatan pasien. Sindrom sleep apnea adalah penyakit pernapasan yang disertai dengkuran, yang dapat menyebabkan kantuk dan kelelahan di siang hari dan juga merupakan penyebab penyakit kardiovaskular.
Saat ini, banyak produk di pasaran yang mengenali dengkuran pasien hanya menetapkan ambang di lingkungan tidur. Ketika sinyal suara yang terdeteksi lebih besar dari ambang, itu dikenali sebagai mendengkur. Namun, metode ini akan salah menilai banyak kebisingan latar belakang sebagai mendengkur. Menanggapi situasi ini, teknologi terkait menggunakan algoritme deteksi mendengkur adaptif tanpa pengawasan untuk mengekstraksi fitur tertentu dari suara, dan menggunakan fitur-fitur ini untuk mengidentifikasi dengkuran, seperti fitur koefisien koefisien frekuensi cepstral MEL, fitur formant, dll., Algoritma tersebut Saat membedakan dengkuran dari kebisingan latar belakang, akurasinya rendah. Selain itu, beberapa metode mendengkur yang diawasi menggunakan jaringan saraf atau metode model untuk mengenali mendengkur. Jenis metode ini memiliki tingkat akurasi yang relatif tinggi, tetapi membutuhkan sejumlah besar sampel pelatihan, dan biaya perangkat keras yang tinggi.
Mengenai masalah teknis biaya tinggi dalam hal meningkatkan akurasi mengidentifikasi dengkuran dalam teknologi terkait, belum ada solusi efektif yang diusulkan.
Elemen realisasi teknis:
Aplikasi ini menyediakan metode dan perangkat, media penyimpanan, dan prosesor untuk mendengkur pengakuan, sehingga dapat memecahkan masalah teknis biaya tinggi dalam hal meningkatkan akurasi pengakuan dengkuran dalam teknologi terkait.
Menurut salah satu aspek dari aplikasi ini, metode untuk mendengkur diberikan. Metode ini meliputi: memperoleh spektrogram data audio target, di mana data audio target adalah data audio yang dikumpulkan selama tidur seseorang, menentukan proporsi energi pertama dalam rentang frekuensi target spektogram; Proporsi energi pertama digunakan untuk mengidentifikasi apakah ada keruh pada data audio target.
Selanjutnya, berdasarkan pada proporsi energi pertama, mengidentifikasi apakah ada dengkuran dalam data audio target termasuk: jika proporsi energi pertama lebih besar atau sama dengan proporsi energi yang telah ditetapkan pertama, mengidentifikasi data audio target Ada mendengkur di dalamnya.
Lebih lanjut, jika proporsi energi pertama kurang dari proporsi energi preset pertama, metode lebih lanjut meliputi: membagi spektrogram dari data audio target sesuai dengan periode yang telah ditentukan; Energi kedua diperhitungkan dalam rentang frekuensi target dalam spektrogram dari empat periode, jika energi kedua diperhitungkan lebih besar atau sama dengan energi preset kedua yang diperhitungkan, maka diidentifikasi bahwa Ada mendengkur.
Lebih lanjut, jika proporsi energi kedua kurang dari proporsi energi preset kedua, metode ini lebih lanjut mencakup: menentukan distribusi energi dari setiap kerangka data dalam spektogram; berdasarkan pada spektogram tersebut Distribusi energi dari frekuensi menentukan durasi dari setiap distribusi energi, berdasarkan pada durasi dari setiap distribusi energi, ditentukan apakah ada mendengkur dalam data audio target.
Selanjutnya, menentukan apakah ada mendengkur dalam data audio target berdasarkan durasi dari setiap distribusi energi meliputi: mengumpulkan komponen pada frekuensi yang berbeda di setiap frame dari data audio target untuk mendapatkan data multi-dimensi, dan menentukan sesuai dengan nilai akumulasi Ambang, data dalam data multidimensi lebih besar dari atau sama dengan nilai ambang diwakili oleh 1, dan data dalam data multidimensi kurang dari nilai ambang dengan 0, untuk mendapatkan matriks indikator, untuk 1 dan 0 dalam matriks indikator Menggabungkan interval untuk mendapatkan matriks yang diproses, berdasarkan pada matriks yang diproses, mengidentifikasi apakah ada mendengkur dalam data audio target.
Selanjutnya, berdasarkan pada matriks yang diproses, mengidentifikasi apakah ada mendengkur dalam data audio target meliputi: menghitung panjang interval dengan nilai 1 dalam matriks yang diproses dan merekam panjang maksimum, dan menghitung sesuai dengan nilai panjang maksimum. Durasi suara, berdasarkan pada durasi suara, identifikasi apakah ada keruh pada data audio target.
Lebih lanjut, metode ini lebih lanjut meliputi: setelah mengidentifikasi apakah ada mendengkur dalam data audio target berdasarkan durasi suara, memasukkan data audio target ke dalam model Gaussian, di mana model Gaussian didasarkan pada data audio target terlebih dahulu. Sebuah model yang dihasilkan oleh pelatihan suara target objek, berdasarkan pada hasil umpan balik dari model Gaussian, mengidentifikasi apakah ada mendengkur dalam data audio target, atau, sebelum memperoleh spektrogram dari data audio target, metode selanjutnya mencakup: Data audio target adalah input ke model Gaussian, berdasarkan hasil umpan balik dari model Gaussian, diakui apakah ada mendengkur dalam data audio target.
Selanjutnya, memperoleh spektrogram data suara meliputi: pengambilan sampel ulang audio asli, melakukan windowing dan framing pada audio sampel ulang, melakukan transformasi Fourier waktu singkat pada setiap frame audio setelah membingkai untuk mendapatkan Spektrogram itu.
Menurut salah satu aspek dari aplikasi ini, tersedia perangkat untuk mendengkur, termasuk: unit yang mengakuisisi untuk memperoleh spektrogram data audio target, di mana data audio target adalah data audio yang dikumpulkan selama tidur; Unit untuk menentukan proporsi energi pertama dalam rentang energi target dalam spektrogram, unit pengidentifikasi untuk mengidentifikasi apakah ada mendengkur dalam data audio target berdasarkan pada proporsi energi pertama.
Menurut aspek aplikasi saat ini, prosesor disediakan, prosesor dikonfigurasi untuk menjalankan program, di mana metode untuk mendengkur yang dijelaskan dalam salah satu di atas dijalankan ketika program sedang berjalan.
Melalui aplikasi ini, langkah-langkah berikut diadopsi: memperoleh spektrogram data audio target, di mana data audio target adalah data audio yang dikumpulkan selama tidur; menentukan proporsi energi pertama dalam rentang energi target dalam spektrogram; Rasio energi untuk mengidentifikasi apakah ada mendengkur dalam data audio target, yang memecahkan masalah teknis biaya tinggi dalam hal meningkatkan akurasi mengidentifikasi dengkuran dalam teknologi terkait. Dengan mengidentifikasi keberadaan mendengkur dalam data audio target berdasarkan proporsi energi pertama dalam rentang energi target, persyaratan algoritma untuk kinerja perangkat keras berkurang sementara akurasi mengidentifikasi dengkur ditingkatkan, sehingga mengurangi biaya perangkat keras yang diperlukan. Pada gilirannya, biaya berkurang dalam hal keakuratan mengidentifikasi suara dengkuran.
Deskripsi gambar
Gambar-gambar yang merupakan bagian dari aplikasi digunakan untuk memberikan pemahaman lebih lanjut tentang aplikasi, dan perwujudan dan deskripsi contoh aplikasi digunakan untuk menjelaskan aplikasi, dan bukan merupakan batasan yang tidak tepat dari aplikasi. Dalam gambar terlampir:
Gambar. 1 adalah diagram alir metode untuk mendengkur yang diberikan sesuai dengan perwujudan aplikasi ini, dan
Gambar 2 adalah diagram skematik dari suatu alat untuk mendengkur yang diberikan sesuai dengan perwujudan aplikasi ini.
Detil Deskripsi
Perlu dicatat bahwa perwujudan dalam aplikasi ini dan fitur dalam perwujudan dapat dikombinasikan satu sama lain jika tidak ada konflik. Selanjutnya, aplikasi ini akan dijelaskan secara rinci dengan mengacu pada gambar dan dalam hubungannya dengan perwujudan.
Untuk memungkinkan mereka yang ahli dalam bidang ini untuk lebih memahami solusi dari aplikasi, solusi teknis dalam perwujudan aplikasi akan dijelaskan dengan jelas dan lengkap dalam hubungannya dengan gambar dalam perwujudan aplikasi. Jelas, perwujudan yang dijelaskan hanya Ini adalah bagian dari perwujudan aplikasi ini, tidak semua perwujudan. Berdasarkan perwujudan dalam aplikasi ini, semua perwujudan lain yang diperoleh oleh orang-orang yang ahli dalam bidang ini tanpa karya kreatif harus berada dalam ruang lingkup perlindungan aplikasi ini.
Perlu dicatat bahwa istilah "pertama" dan "kedua" dalam spesifikasi dan klaim aplikasi dan gambar yang disebutkan di atas digunakan untuk membedakan objek yang serupa, dan tidak harus digunakan untuk menggambarkan urutan atau urutan tertentu. Harus dipahami bahwa data yang digunakan dengan cara ini dapat dipertukarkan dalam keadaan yang sesuai untuk keperluan perwujudan aplikasi ini yang dijelaskan di sini. Selain itu, istilah "termasuk" dan "memiliki" dan setiap variasi dari mereka dimaksudkan untuk mencakup inklusi non-eksklusif. Misalnya, suatu proses, metode, sistem, produk atau perangkat yang mencakup serangkaian langkah atau unit tidak selalu terbatas pada daftar yang tercantum secara jelas. Langkah atau unit tersebut dapat mencakup langkah atau unit lain yang tidak tercantum secara jelas atau melekat pada proses, metode, produk, atau peralatan ini.
Menurut perwujudan aplikasi ini, metode untuk mendengkur diakui.
Gambar. 1 adalah diagram alir metode untuk mendengkur pengakuan sesuai dengan perwujudan aplikasi ini. Seperti yang ditunjukkan pada Gambar 1, metode ini mencakup langkah-langkah berikut:
Langkah S101: Dapatkan spektrogram data audio target, di mana data audio target adalah data audio yang dikumpulkan saat seseorang sedang tidur.
Adegan mendengkur umumnya adalah proses orang tidur. Kebisingan latar belakang di lingkungan mungkin adalah suara AC, suara kipas, suara TV, suara yang dihasilkan oleh peralatan listrik dan sejumlah kecil orang berbicara. Oleh karena itu, suara dengkuran dideteksi sesuai dengan skenario ini, dan spektrogram dari data audio yang dikumpulkan selama proses tidur diperoleh. Dalam proses aplikasi yang sebenarnya, cara untuk mendapatkan data audio target dapat dengan mendeteksi data audio pengguna selama tidur secara real time melalui sensor suara, seperti melalui mikrofon yang diatur secara khusus, atau melalui ponsel, tablet atau fungsi pendeteksi suara lainnya. perangkat.
Sebagai contoh, data audio asli (yang dapat diunduh atau direkam) di-resampled menjadi 16KHz. Frekuensi pengambilan sampel umumnya 8KHz, 16KHz, dan 48KHz. Untuk memudahkan pemrosesan terpadu, data diamplampatkan menjadi 16kHz. Dalam perwujudan aplikasi ini, suara dengkuran Tidak ada batasan spesifik pada panjang suara. Menimbang bahwa periode audio mendengkur berada dalam kisaran 2s-5s, panjang audio yang dipilih harus lebih dari 10s. Dalam proses aplikasi yang sebenarnya, cara untuk mendapatkan data audio asli juga dapat mendeteksi data audio orang yang tidur secara real time melalui sensor suara, seperti melalui mikrofon yang diatur secara khusus, atau melalui ponsel, tablet atau perangkat lain dengan deteksi suara. Peralatan fungsional. Menjendela dan membingkai data audio setelah dilakukan resampling. Ambil suara dengkuran murni sebagai contoh, dengan asumsi durasinya sekitar 12 detik, frekuensi pengambilan sampel 16 KHz, dan ada total titik pengambilan sampel 192.000 (12 * 16 ribu). Suara ini berjendela. Bingkai, fungsi jendela memilih jendela Hamming, panjang bingkai 128 = 0,987.654 sampel (8 ms), tingkat pengulangan bingkai 50%, yaitu, 64 sampel, dan panjang jendela sama dengan panjang bingkai, kemudian diperoleh setelah windowing dan framing 2999 frame (fix (192000-128 / 64) +1, fix berarti pembulatan), transformasi STFT (transformasi Fourier waktu-pendek) dilakukan pada setiap frame untuk mendapatkan spektrogram.
Secara opsional, dalam metode untuk mendengkur yang disediakan dalam perwujudan aplikasi ini, memperoleh spektrogram data suara meliputi: pengambilan sampel ulang audio asli, melakukan windowing dan framing pada audio sampel ulang; Setelah setiap frame audio, transformasi Fourier waktu singkat dilakukan untuk mendapatkan spektogram.
Langkah S102: Tentukan proporsi energi pertama dalam rentang energi target dalam spektrogram.
Misalnya, jika rentang energi target adalah energi dalam kisaran 0-2KHz, proporsi energi dalam kisaran 0-2KHz dalam spektogram ditentukan sebagai proporsi energi pertama yang disebutkan di atas.
Langkah S103, berdasarkan pada rasio energi pertama, mengidentifikasi apakah ada mendengkur dalam data audio target.
Secara opsional, dalam metode untuk mendengkur yang disediakan dalam perwujudan aplikasi ini, berdasarkan pada proporsi energi pertama, mengidentifikasi apakah ada mendengkur dalam data audio target meliputi: jika proporsi energi pertama lebih besar dari atau sama dengan proporsi energi preset pertama, Diakui bahwa ada suara mendengkur di data audio target.
Saat mendeteksi dengkuran, suara lain yang paling mungkin salah menilai sebagai mendengkur adalah ucapan manusia dan kebisingan latar belakang. Ambil data dalam contoh ini sebagai contoh, laju pengambilan sampel 16KHz, 128 titik pengambilan sampel sebagai bingkai, setelah STFT, sumbu horizontal akan mendapatkan 65 tempat frekuensi (128/2 + 1), dimensi sumbu horizontal mewakili waktu (dibagi dengan bingkai ), total 2999 dimensi. Spektrogram menunjukkan bahwa 8KHz dibagi sama rata menjadi 65 bagian, maka total energi 0-2KHz dapat diwakili oleh total energi dari 1-16 tempat sampah.Pada kumpulan data ini, proporsi energi mendengkur murni 0-2KHz berada di atas 0,95 , Dan secara umum, energi wicara manusia dan kebisingan latar belakang 0-2KHz hanya menyumbang 0,2-0,5. Dengan demikian, suara dengkuran dapat dideteksi sesuai dengan rasio energi.
Metode untuk mendengkur yang diberikan oleh perwujudan aplikasi ini memperoleh spektrogram data audio target, di mana data audio target adalah data audio yang dikumpulkan selama tidur seseorang, energi pertama dalam rentang energi target dalam spektogram ditentukan. Rasio; Berdasarkan proporsi energi pertama, identifikasi apakah ada mendengkur dalam data audio target, yang memecahkan masalah teknis biaya tinggi dalam hal meningkatkan akurasi mengidentifikasi mendengkur dalam teknologi terkait. Dengan mengidentifikasi keberadaan mendengkur dalam data audio target berdasarkan proporsi energi pertama dalam rentang energi target, persyaratan algoritma untuk kinerja perangkat keras berkurang sementara akurasi mengidentifikasi dengkur ditingkatkan, sehingga mengurangi biaya perangkat keras yang diperlukan. Pada gilirannya, biaya berkurang dalam hal keakuratan mengidentifikasi suara dengkuran.
Secara opsional, dalam metode untuk mendengkur yang disediakan dalam perwujudan aplikasi ini, jika proporsi energi pertama lebih kecil dari proporsi energi preset pertama, metode ini lebih lanjut mencakup: melakukan spektrogram dari data audio target sesuai dengan periode yang telah ditentukan. Bagilah, hitung proporsi energi kedua dalam rentang frekuensi target dalam spektrogram setiap periode setelah pembagian, jika proporsi energi kedua lebih besar dari atau sama dengan proporsi energi prasetel kedua, diakui bahwa data audio target ada mendengkur.
Dalam skema di atas, sulit untuk mendeteksi suara mendengkur secara langsung jika ada kebisingan latar belakang yang tercampur di bagian suara dengkuran yang diterima.Namun, suara dengkuran memiliki periodisitas tertentu, dari periode suara dengkuran di kisaran 2s-5s, dan suara dari tiga periode pertama Sebarkan seluruh pita frekuensi, dan spektrum frekuensi dari dua periode berikutnya tidak terlalu terpengaruh oleh noise, sehingga dengkuran dalam hal ini dapat dideteksi menurut langkah-langkah berikut: (1) Mendeteksi dan membagi periode mendengkur, misalnya, membagi periode mendengkur ke dalam 5 paragraf. (2) Hitung persentase energi 0-2KHz (sesuai dengan rentang frekuensi preset yang disebutkan di atas) dengan total energi pita frekuensi untuk setiap segmen dengkuran. (3) Menilai bagian demi bagian, jika ada bagian tertentu dari rasio energi 0-2KHz di atas 0,9 (sesuai dengan rasio energi prasetel kedua di atas), maka dinilai ada mendengkur di bagian data audio ini.
Secara opsional, dalam metode untuk mendengkur yang disediakan oleh perwujudan aplikasi ini, jika proporsi energi kedua kurang dari proporsi energi preset kedua, metode ini lebih lanjut mencakup: menentukan distribusi energi dari setiap kerangka data dalam spektogram; Tentukan durasi dari setiap distribusi energi berdasarkan pada distribusi energi dari frekuensi dalam spektrogram, tentukan apakah ada mendengkur dalam data audio target berdasarkan pada durasi dari setiap distribusi energi.
Dalam solusi di atas, jika seluruh segmen audio mendengkur dicampur dengan kebisingan latar belakang, dengkuran dapat dideteksi dengan langkah-langkah berikut. Gunakan periodisitas untuk membedakan audio: Hitung distribusi energi secara longitudinal, hitung proporsi energi di setiap frame, distribusi energi secara berkala, dan terkonsentrasi dalam 0s-2s, 4s-6s, 8s-10s. Secara umum, periode suara mendengkur sebagian besar dalam 2s-5s. Oleh karena itu, sebagian dari suara non-dengkuran dapat disaring berdasarkan lamanya periode, sehingga apakah ada suara dengkuran dalam data audio target dapat ditentukan berdasarkan durasi dari setiap distribusi energi.
Secara opsional, dalam metode untuk mendengkur yang disediakan dalam perwujudan aplikasi ini, menentukan apakah ada mendengkur dalam data audio target berdasarkan durasi dari setiap distribusi energi meliputi: mengumpulkan komponen pada frekuensi yang berbeda di setiap bingkai data audio target, Dapatkan data multi-dimensi, tentukan ambang batas sesuai dengan nilai akumulasi, dan buat data dalam data multi-dimensi lebih besar dari