Phương pháp và thiết bị để nhận biết ngáy, phương tiện lưu trữ, bộ xử lý và quy trình
Ứng dụng này liên quan đến lĩnh vực công nghệ xử lý thông tin, và đặc biệt là phương pháp và thiết bị để nhận biết tiếng ngáy, phương tiện lưu trữ và bộ xử lý.
Kỹ thuật nền:
Ngáy là một hiện tượng rất phổ biến. Khoảng 20% -40% số người bị các triệu chứng ngáy. Ngáy không chỉ gây rắc rối cho bệnh nhân, ảnh hưởng đến đồng nghiệp của họ, mà còn đe dọa sức khỏe của bệnh nhân. Hội chứng ngưng thở khi ngủ tắc nghẽn là một bệnh về đường hô hấp kèm theo ngáy, có thể gây buồn ngủ và mệt mỏi trong ngày và cũng là một nguyên nhân gây ra bệnh tim mạch.
Hiện tại, nhiều sản phẩm trên thị trường nhận biết tiếng ngáy của bệnh nhân chỉ đặt ngưỡng trong môi trường ngủ. Khi tín hiệu âm thanh được phát hiện lớn hơn ngưỡng, nó được công nhận là ngáy. Tuy nhiên, phương pháp này sẽ đánh giá sai nhiều tiếng ồn nền là ngáy. Để đối phó với tình huống này, các công nghệ liên quan sử dụng thuật toán phát hiện ngáy không có giám sát thích ứng để trích xuất một số tính năng từ âm thanh và sử dụng các tính năng này để xác định tiếng ngáy, như các tính năng hệ số cepstral tần số MEL, các tính năng định dạng, v.v. Khi phân biệt tiếng ngáy với tiếng ồn nền, độ chính xác thấp. Ngoài ra, một số phương pháp nhận biết ngáy có giám sát sử dụng mạng thần kinh hoặc phương pháp mô hình để nhận biết ngáy. Loại phương pháp này có tỷ lệ chính xác tương đối cao, nhưng yêu cầu số lượng mẫu đào tạo lớn và chi phí phần cứng cao.
Liên quan đến vấn đề kỹ thuật với chi phí cao trong trường hợp cải thiện độ chính xác của việc xác định ngáy trong công nghệ liên quan, chưa có giải pháp hiệu quả nào được đề xuất.
Các yếu tố thực hiện kỹ thuật:
Ứng dụng hiện tại cung cấp một phương pháp và thiết bị, phương tiện lưu trữ và bộ xử lý để nhận biết tiếng ngáy, để giải quyết vấn đề kỹ thuật với chi phí cao trong trường hợp cải thiện độ chính xác của nhận dạng ngáy trong các công nghệ liên quan.
Theo một khía cạnh của ứng dụng hiện tại, một phương pháp để nhận biết tiếng ngáy được cung cấp. Phương pháp này bao gồm: lấy biểu đồ phổ của dữ liệu âm thanh đích, trong đó dữ liệu âm thanh đích là dữ liệu âm thanh được thu thập trong khi ngủ của một người, xác định tỷ lệ năng lượng đầu tiên trong dải tần số đích của phổ; Tỷ lệ năng lượng đầu tiên được sử dụng để xác định xem có ngáy trong dữ liệu âm thanh đích hay không.
Hơn nữa, dựa trên tỷ lệ năng lượng đầu tiên, xác định xem có ngáy trong dữ liệu âm thanh đích bao gồm: nếu tỷ lệ năng lượng đầu tiên lớn hơn hoặc bằng tỷ lệ năng lượng đặt trước đầu tiên, xác định dữ liệu âm thanh đích Có ngáy trong đó.
Hơn nữa, nếu tỷ lệ của năng lượng đầu tiên nhỏ hơn tỷ lệ của năng lượng đặt trước đầu tiên, thì phương pháp này bao gồm thêm: chia biểu đồ phổ của dữ liệu âm thanh đích theo một khoảng thời gian định sẵn; Năng lượng thứ hai chiếm trong phạm vi tần số mục tiêu trong phổ của bốn chu kỳ, nếu năng lượng thứ hai chiếm lớn hơn hoặc bằng năng lượng định sẵn thứ hai chiếm, thì nó được xác định là dữ liệu âm thanh đích Có ngáy.
Hơn nữa, nếu tỷ lệ năng lượng thứ hai nhỏ hơn tỷ lệ năng lượng đặt trước thứ hai, phương pháp này bao gồm thêm: xác định phân bố năng lượng của từng khung dữ liệu trong biểu đồ phổ, dựa trên biểu đồ phổ Phân phối năng lượng của tần số xác định thời lượng của mỗi phân phối năng lượng, dựa trên thời lượng của mỗi phân phối năng lượng, nó được xác định xem có ngáy trong dữ liệu âm thanh đích hay không.
Hơn nữa, việc xác định xem có ngáy trong dữ liệu âm thanh đích hay không dựa trên thời lượng của mỗi phân phối năng lượng bao gồm: tích lũy các thành phần ở các tần số khác nhau trong mỗi khung của dữ liệu âm thanh đích để có được dữ liệu đa chiều và xác định theo giá trị tích lũy Ngưỡng, dữ liệu trong dữ liệu đa chiều lớn hơn hoặc bằng giá trị ngưỡng được biểu thị bằng 1 và dữ liệu trong dữ liệu đa chiều nhỏ hơn giá trị ngưỡng bằng 0, để có được ma trận chỉ báo, cho 1 và 0 trong ma trận chỉ báo Hợp nhất các khoảng để có được một ma trận được xử lý, dựa trên ma trận được xử lý, xác định xem có tiếng ngáy trong dữ liệu âm thanh đích hay không.
Hơn nữa, dựa trên ma trận được xử lý, xác định xem có ngáy trong dữ liệu âm thanh đích hay không bao gồm: đếm độ dài của khoảng với giá trị 1 trong ma trận được xử lý và ghi lại độ dài tối đa; và tính theo giá trị của độ dài tối đa Thời lượng của âm thanh, dựa trên thời lượng của âm thanh, xác định xem có tiếng ngáy trong dữ liệu âm thanh đích hay không.
Hơn nữa, phương pháp còn bao gồm: sau khi xác định liệu có ngáy trong dữ liệu âm thanh đích hay không dựa trên thời lượng của âm thanh, đưa dữ liệu âm thanh đích vào mô hình Gaussian, trong đó mô hình Gaussian dựa trên dữ liệu âm thanh đích trước. Một mô hình được tạo bởi đào tạo âm thanh đích của đối tượng, dựa trên kết quả phản hồi của mô hình Gaussian, xác định xem có ngáy trong dữ liệu âm thanh đích hay không, trước khi có được phổ của dữ liệu âm thanh đích, phương pháp này bao gồm: Dữ liệu âm thanh đích được nhập vào mô hình Gaussian, dựa trên kết quả phản hồi của mô hình Gaussian, nó được nhận ra liệu có ngáy trong dữ liệu âm thanh đích hay không.
Hơn nữa, thu được biểu đồ phổ của dữ liệu âm thanh bao gồm: lấy mẫu lại âm thanh gốc, thực hiện cửa sổ và đóng khung trên âm thanh lấy mẫu lại, thực hiện chuyển đổi Fourier thời gian ngắn trên mỗi khung âm thanh sau khi tạo khung Các phổ.
Theo một khía cạnh của ứng dụng hiện tại, đã cung cấp một thiết bị để nhận biết tiếng ngáy, bao gồm: một đơn vị thu nhận để có được một phổ dữ liệu âm thanh đích, trong đó dữ liệu âm thanh đích là dữ liệu âm thanh được thu thập trong khi ngủ; Một đơn vị để xác định tỷ lệ năng lượng đầu tiên trong dải năng lượng mục tiêu trong phổ, một đơn vị xác định để xác định xem có ngáy trong dữ liệu âm thanh đích dựa trên tỷ lệ năng lượng đầu tiên hay không.
Theo một khía cạnh của ứng dụng hiện tại, bộ xử lý được cung cấp, bộ xử lý được cấu hình để chạy chương trình, trong đó phương thức nhận biết tiếng ngáy được mô tả trong bất kỳ một trong những điều trên được thực thi khi chương trình đang chạy.
Thông qua ứng dụng này, các bước sau đây được thông qua: lấy biểu đồ phổ của dữ liệu âm thanh đích, trong đó dữ liệu âm thanh đích là dữ liệu âm thanh được thu thập trong khi ngủ, xác định tỷ lệ năng lượng đầu tiên trong dải năng lượng đích trong quang phổ; Tỷ lệ năng lượng để xác định xem có ngáy trong dữ liệu âm thanh đích hay không, giải quyết vấn đề kỹ thuật với chi phí cao trong trường hợp cải thiện độ chính xác của việc xác định ngáy trong các công nghệ liên quan. Bằng cách xác định sự hiện diện của tiếng ngáy trong dữ liệu âm thanh đích dựa trên tỷ lệ năng lượng đầu tiên trong dải năng lượng đích, các yêu cầu của thuật toán đối với hiệu suất phần cứng được giảm trong khi độ chính xác của việc xác định tiếng ngáy được cải thiện, do đó giảm chi phí cho phần cứng cần thiết. Đổi lại, chi phí được giảm trong trường hợp độ chính xác của việc xác định âm thanh ngáy.
Mô tả bản vẽ
Các bản vẽ cấu thành một phần của ứng dụng được sử dụng để cung cấp hiểu biết sâu hơn về ứng dụng, và các phương án và mô tả mẫu mực của ứng dụng được sử dụng để giải thích ứng dụng và không cấu thành giới hạn không chính xác của ứng dụng. Trong hình đính kèm:
Hình. 1 là sơ đồ của phương pháp nhận biết tiếng ngáy được cung cấp theo phương án của ứng dụng hiện tại và
Hình 2 là sơ đồ nguyên lý của một thiết bị để nhận biết tiếng ngáy theo phương án của ứng dụng hiện tại.
miêu tả cụ thể
Cần lưu ý rằng các phương án trong ứng dụng này và các tính năng trong phương án có thể được kết hợp với nhau nếu không có xung đột. Sau đây, ứng dụng hiện tại sẽ được mô tả chi tiết với tham chiếu đến các bản vẽ và kết hợp với các phương án.
Để cho phép những người có kỹ năng trong nghệ thuật hiểu rõ hơn về giải pháp của ứng dụng, các giải pháp kỹ thuật trong các phương án của ứng dụng sẽ được mô tả rõ ràng và hoàn toàn kết hợp với các bản vẽ trong các phương án của ứng dụng. Đây là một phần của các phương án của ứng dụng này, không phải tất cả các phương án. Dựa trên các phương án trong ứng dụng này, tất cả các phương án khác có được từ những người có kỹ năng thông thường trong nghệ thuật mà không có công việc sáng tạo nên nằm trong phạm vi bảo vệ của ứng dụng này.
Cần lưu ý rằng các thuật ngữ "đầu tiên" và "thứ hai" trong đặc tả và yêu cầu của ứng dụng và các bản vẽ được đề cập ở trên được sử dụng để phân biệt các đối tượng tương tự và không nhất thiết được sử dụng để mô tả một chuỗi hoặc trình tự cụ thể. Cần hiểu rằng dữ liệu được sử dụng theo cách này có thể được hoán đổi trong các trường hợp thích hợp cho các mục đích của các phương án của ứng dụng hiện tại được mô tả trong tài liệu này. Ngoài ra, các thuật ngữ "bao gồm" và "có" và bất kỳ biến thể nào của chúng đều nhằm mục đích bao gồm các khoản bao gồm không độc quyền. Ví dụ: quy trình, phương pháp, hệ thống, sản phẩm hoặc thiết bị bao gồm một loạt các bước hoặc đơn vị không nhất thiết bị giới hạn trong danh sách rõ ràng Các bước hoặc đơn vị đó có thể bao gồm các bước hoặc đơn vị khác không được liệt kê rõ ràng hoặc vốn có của các quy trình, phương pháp, sản phẩm hoặc thiết bị này.
Theo một phương án của ứng dụng hiện tại, một phương pháp để nhận biết tiếng ngáy được cung cấp.
Hình. 1 là sơ đồ của phương pháp nhận biết ngáy theo phương án của ứng dụng hiện tại. Như được hiển thị trong Hình 1, phương thức này bao gồm các bước sau:
Bước S101: Thu thập một phổ dữ liệu âm thanh đích, trong đó dữ liệu âm thanh đích là dữ liệu âm thanh được thu thập trong khi một người đang ngủ.
Cảnh ngáy nói chung là quá trình mọi người ngủ. Tiếng ồn nền trong môi trường có thể là âm thanh điều hòa, âm thanh quạt, âm thanh TV, âm thanh được tạo ra bởi các thiết bị điện và một số ít người nói chuyện. Do đó, âm thanh ngáy được phát hiện theo kịch bản này và thu được biểu đồ phổ của dữ liệu âm thanh trong quá trình ngủ. Trong quy trình ứng dụng thực tế, cách để có được dữ liệu âm thanh đích có thể là phát hiện dữ liệu âm thanh của người dùng trong khi ngủ trong thời gian thực thông qua cảm biến âm thanh, chẳng hạn như qua micrô được đặt đặc biệt hoặc qua điện thoại di động, máy tính bảng hoặc chức năng phát hiện âm thanh khác thiết bị của.
Ví dụ: dữ liệu âm thanh gốc (có thể được tải xuống hoặc ghi lại) được ghép lại thành 16KHz. Tần số lấy mẫu thường là 8KHz, 16KHz và 48KHz. Không có giới hạn cụ thể về độ dài của giọng nói. Xem xét rằng thời gian âm thanh của tiếng ngáy nằm trong phạm vi 2 giây, độ dài âm thanh được chọn phải là hơn 10 giây. Trong quy trình ứng dụng thực tế, cách để có được dữ liệu âm thanh gốc cũng có thể là phát hiện dữ liệu âm thanh của người đang ngủ trong thời gian thực thông qua cảm biến âm thanh, chẳng hạn như qua micrô được đặt đặc biệt hoặc qua điện thoại di động, máy tính bảng hoặc thiết bị khác có phát hiện âm thanh Thiết bị chức năng. Lấy ví dụ về cửa sổ và đóng khung dữ liệu âm thanh. Lấy một âm thanh ngáy thuần túy làm ví dụ, giả sử rằng thời lượng là khoảng 12 giây, tần số lấy mẫu là 16KHz và có tổng số 192000 (12 * 16K) điểm lấy mẫu. Khung, chức năng cửa sổ chọn cửa sổ Hamming, chiều dài khung là 128 = 0,987,654 mẫu (8ms), tỷ lệ lặp lại khung là 50%, nghĩa là 64 mẫu và chiều dài cửa sổ giống với chiều dài khung, sau đó lấy được sau khi đóng và đóng khung 2999 khung hình (sửa chữa (192000-128 / 64) +1, sửa có nghĩa là làm tròn), biến đổi STFT (biến đổi Fourier thời gian ngắn) được thực hiện trên mỗi khung hình để thu được phổ.
Tùy chọn, trong phương pháp nhận dạng tiếng ngáy được cung cấp trong phương án của ứng dụng hiện tại, thu được biểu đồ phổ của dữ liệu âm thanh bao gồm: lấy mẫu lại âm thanh gốc, thực hiện cửa sổ và đóng khung âm thanh lấy mẫu lại; Sau mỗi khung hình của âm thanh, biến đổi Fourier thời gian ngắn được thực hiện để thu được biểu đồ phổ.
Bước S102: Xác định tỷ lệ năng lượng đầu tiên trong dải năng lượng mục tiêu trong biểu đồ phổ.
Ví dụ: nếu dải năng lượng mục tiêu là năng lượng trong phạm vi 0-2KHz, tỷ lệ năng lượng trong phạm vi 0-2KHz trong biểu đồ phổ được xác định là tỷ lệ năng lượng đầu tiên được đề cập ở trên.
Bước S103, dựa trên tỷ lệ năng lượng đầu tiên, xác định xem có ngáy trong dữ liệu âm thanh đích hay không.
Tùy chọn, trong phương pháp nhận dạng tiếng ngáy được cung cấp trong phương án của ứng dụng hiện tại, dựa trên tỷ lệ năng lượng đầu tiên, xác định xem có ngáy trong dữ liệu âm thanh đích bao gồm: nếu tỷ lệ năng lượng đầu tiên lớn hơn hoặc bằng tỷ lệ năng lượng đặt trước đầu tiên, Người ta nhận ra rằng có một tiếng ngáy trong dữ liệu âm thanh đích.
Khi phát hiện ngáy, các âm thanh khác rất có thể bị đánh giá sai là ngáy là tiếng nói của con người và tiếng ồn nền. Lấy dữ liệu trong ví dụ này làm ví dụ, tốc độ lấy mẫu là 16KHz, 128 điểm lấy mẫu làm khung, sau STFT, trục ngang sẽ nhận được 65 thùng tần số (128/2 + 1), kích thước trục ngang biểu thị thời gian (chia cho khung ), tổng cộng 2999 kích thước. Biểu đồ phổ cho thấy 8KHz được chia thành 65 phần bằng nhau, sau đó tổng năng lượng 0-2KHz có thể được biểu thị bằng tổng năng lượng của các thùng tần số 1-16. Trong bộ dữ liệu này, tỷ lệ năng lượng ngáy 0-2KHz thuần túy là trên 0,95 , Và nói chung, năng lượng của tiếng nói và tiếng ồn nền của con người 0-2KHz chỉ chiếm 0,2-0,5. Do đó, âm thanh ngáy có thể được phát hiện theo tỷ lệ năng lượng.
Phương pháp nhận dạng tiếng ngáy được cung cấp bởi các phương án của ứng dụng hiện tại thu được một biểu đồ phổ của dữ liệu âm thanh đích, trong đó dữ liệu âm thanh đích là dữ liệu âm thanh được thu thập trong khi ngủ của một người, năng lượng đầu tiên trong dải năng lượng đích trong quang phổ được xác định Tỷ lệ; Dựa trên tỷ lệ năng lượng đầu tiên, xác định xem có ngáy trong dữ liệu âm thanh đích hay không, giải quyết vấn đề kỹ thuật với chi phí cao trong trường hợp cải thiện độ chính xác của việc xác định ngáy trong các công nghệ liên quan. Bằng cách xác định sự hiện diện của tiếng ngáy trong dữ liệu âm thanh đích dựa trên tỷ lệ năng lượng đầu tiên trong dải năng lượng đích, các yêu cầu của thuật toán đối với hiệu suất phần cứng được giảm trong khi độ chính xác của việc xác định tiếng ngáy được cải thiện, do đó giảm chi phí cho phần cứng cần thiết. Đổi lại, chi phí được giảm trong trường hợp độ chính xác của việc xác định âm thanh ngáy.
Tùy chọn, trong phương pháp nhận biết tiếng ngáy được cung cấp trong phương án của ứng dụng hiện tại, nếu tỷ lệ của năng lượng đầu tiên nhỏ hơn tỷ lệ của năng lượng đặt trước đầu tiên, phương pháp này bao gồm: thực hiện phổ của dữ liệu âm thanh đích theo khoảng thời gian định sẵn Chia, tính tỷ lệ năng lượng thứ hai trong dải tần số đích trong phổ của từng giai đoạn sau khi phân chia, nếu tỷ lệ năng lượng thứ hai lớn hơn hoặc bằng tỷ lệ năng lượng đặt trước thứ hai, có thể nhận ra rằng dữ liệu âm thanh đích tồn tại ngáy.
Trong sơ đồ trên, rất khó phát hiện trực tiếp âm thanh ngáy nếu có tiếng ồn nền trộn lẫn trong phần âm thanh ngáy nhận được. Tuy nhiên, âm thanh ngáy có một chu kỳ nhất định, từ giai đoạn ngáy trong khoảng 2s-5s và tiếng ồn của ba giai đoạn đầu Trải rộng trên toàn bộ dải tần và phổ tần số của hai giai đoạn tiếp theo ít bị ảnh hưởng bởi tiếng ồn, do đó, tiếng ngáy trong trường hợp này có thể được phát hiện theo các bước sau: (1) Phát hiện và phân chia thời gian ngáy, ví dụ, chia thời gian ngáy thành 5 đoạn. (2) Tính tỷ lệ phần trăm của năng lượng 0-2KHz (tương ứng với dải tần số đặt trước đã đề cập ở trên) với tổng năng lượng của dải tần số cho từng phân đoạn ngáy. (3) Đánh giá từng phần, nếu có một phần nhất định tỷ lệ năng lượng 0-2KHz trên 0,9 (tương ứng với tỷ lệ năng lượng đặt trước thứ hai ở trên), thì người ta đánh giá rằng có tiếng ngáy trong phần dữ liệu âm thanh này.
Tùy chọn, trong phương pháp nhận biết tiếng ngáy do phương án của ứng dụng hiện tại cung cấp, nếu tỷ lệ năng lượng thứ hai nhỏ hơn tỷ lệ năng lượng đặt trước thứ hai, phương pháp này bao gồm: xác định phân bố năng lượng của từng khung dữ liệu trong phổ; Xác định thời lượng của mỗi phân phối năng lượng dựa trên phân phối năng lượng của tần số trong biểu đồ phổ, xác định xem có ngáy trong dữ liệu âm thanh đích dựa trên thời lượng của mỗi phân phối năng lượng hay không.
Trong giải pháp trên, nếu toàn bộ phân đoạn âm thanh ngáy được trộn lẫn với tiếng ồn nền, tiếng ngáy có thể được phát hiện theo các bước sau. Sử dụng định kỳ để phân biệt âm thanh: Tính toán phân phối năng lượng theo chiều dọc, tính tỷ lệ năng lượng trong mỗi khung, phân phối năng lượng theo định kỳ và tập trung trong 0s-2s, 4s-6s, 8s-10s. Nói chung, thời gian của âm thanh ngáy chủ yếu là trong khoảng 2 giây. Do đó, một phần của âm thanh không ngáy có thể được lọc theo độ dài của chu kỳ, do đó, liệu có thể xác định được âm thanh ngáy trong dữ liệu âm thanh đích dựa trên thời lượng của mỗi lần phân phối năng lượng hay không.
Tùy chọn, trong phương pháp nhận dạng tiếng ngáy do phương án của ứng dụng hiện tại cung cấp, xác định xem có ngáy trong dữ liệu âm thanh đích hay không dựa trên thời lượng của mỗi phân phối năng lượng bao gồm: tích lũy các thành phần ở các tần số khác nhau trong mỗi khung của dữ liệu âm thanh đích, Lấy dữ liệu đa chiều, xác định ngưỡng theo giá trị tích lũy và làm cho dữ liệu trong dữ liệu đa chiều lớn hơn