LỜi cam đoan



tải về 280.46 Kb.
trang7/10
Chuyển đổi dữ liệu27.09.2016
Kích280.46 Kb.
#32462
1   2   3   4   5   6   7   8   9   10

1.14Kết luận chương


Chương này đã trình bày một số phương pháp đánh giá chất lượng tiếng nói sau khi xử lý giảm nhiễu bằng các thuật toán tăng cường tiếng nói. Các đánh giá SE được giới thiệu gồm có các phương pháp đánh giá tuyệt đối và đánh giá tương đối. Các phương pháp đánh giá OE được trình bày chính trong chương này gồm : Đo SNRseg, đánh giá LLR, IS và WSS, trong phần này cũng đã giới thiệu sơ bộ về BSD và PESQ


CHƯƠNG 3: THUẬT TOÁN SPECTRAL–SUBTRACTION VÀ WIENER FILTERING



1.15Giới thiệu chương


Nội dung của chương này trình bày nguyên lý chung của thuật toán Spectral – subtraction và Wiener filtering,nguyên lý cơ bản của từng thuật toán, các bước thực hiện cần thiết để phân tích liên kết tín hiệu, đề cập đến vấn đề ước luợng nhiễu, vấn đề này ảnh hưởng rất lớn đến quá trình xử lý

1.16Sơ đồ khối chung của Spectral Subtraction và Wiener Filtering


Trong đồ án này, chúng tôi đã dựa trên các cở sở lý thuyết của các thuật toán đã có trong speech enhancement, và đã lựa chọn ra 2 thuật toán đó là : Spectral subtraction và Wiener filter để sử dụng làm thuật toán xử lý triệt nhiễu.

Sơ đồ khối chung cho cả 2 thuật toán :



Hình 3.1 Sơ đồ khối cho hai thuật toán SS và WF

Cả 2 thuật toán Spectral subtraction và Wiener filter chỉ khác nhau ở khối hàm xử lý triệt nhiễu, tất cả các khối còn lại thì giống nhau.

1.17Thuật toán Spectral Subtraction

1.17.1Giới thiệu chung


Spectral – subtraction là thuật toán được đề xuất sớm nhất trong các thuật toán được sử dụng để giảm nhiễu trong tín hiệu. Đã có rất nhiều bài luận mô tả các biến thể của thuật toán này so với các thuật toán khác. Nó dựa trên một nguyên tắc cơ bản, thừa nhận sự có mặt của nhiễu, nó có thể đạt được mục đích ước lượng phổ của tiếng nói sạch bằng cách trừ đi phổ của nhiễu với phổ của tiếng nói đã bị nhiễu. Phổ của nhiễu có thể được ước lượng, cập nhật trong nhiều chu kỳ khi không có mặt của tín hiệu. Sự thừa nhận đó chỉ được thực hiện đối với nhiễu không đổi hoặc có tốc độ xử lý biến đổi chậm, và khi đó phổ của nhiễu sẽ không thay đổi đáng kể giữa các khoảng thời gian cập nhật. Việc tăng cường tín hiệu đạt được bằng cách tính IDFT(biến đổi Fourier rời rạc ngược) của phổ tín hiệu đã được ước lượng có sử dụng pha của tín hiệu có nhiễu. Thuật toán này là một phép tính ước lượng đơn giản vì nó chỉ gồm biến đổi DFT thuận và DFT ngược.

Quá trình xử lý hiệu đơn giản như vậy phải trả một cái giá, nếu quá trình xử lý không được thực hiện một cách cẩn thận thì tiếng nói của chúng ta sẽ bị méo. Nếu như việc lấy hiệu quá lớn thì có thể loại bỏ đi một phần thông tin của tiếng nói, còn nếu việc thực hiện lấy hiệu đó nhỏ thì nhiễu sẽ vẫn còn được giữ lại trong tín hiệu. Có rất nhiều phương pháp được đề xuất để giảm đi hầu hết méo trong quá trình xử lý tiếng nói bằng spectral subtraction[21], và trong số đó cũng có một vài trường hợp bị loại bỏ.


1.17.2Spectral subtraction đối với phổ biên độ


Giả thiết rằng y[n] là tín hiệu vào đã bị nhiễu, nó tổng của tín hiệu sạch x[n] và tín hiệu nhiễu d[n]:

y[n] = x[n] + d[n] (3.1)

Thực hiện biến đổi Fourier rời rạc cả 2 vế,ta được

(3.2)

Chúng ta có thể biểu diễn Y() dưới dạng phức như sau:



(3.3)

Khi đó |Y()| là biên độ phổ, và là pha của tín hiệu đã bị nhiễu.

Phổ của tín hiệu nhiễu D() có thể được biểu diễn dạng biên độ và pha:

(3.4)

Biên độ phổ của nhiễu |D()| không xác định được, nhưng có thể thay thế bằng giá trị trung bình của nó được tính trong khi không có tiếng nói(tiếng nói bị dừng), và pha của tín hiệu nhiễu có thể thay thế bằng pha của tín hiệu bị nhiễu , việc làm này không ảnh hưởng đến tính dễ nghe của tiếng nói [22], có thể ảnh hưởng đến chất lượng của tiếng nói là làm thay đổi pha của tiếng nói nhưng cũng chỉ vài độ.

Khi đó chúng ta có thể ước lượng được phổ của tín hiệu sạch:

(3.5)

ở đây || là biên độ phổ ước lượng của nhiễu được tính trong khi không có tiếng nói hoạt động. Ký hiệu để chỉ rằng giá trị đó là giá trị ước tính gần đúng. Tín hiệu tiếng nói được tăng cường có thể đạt được bằng cách rất đơn giản là biến đổi IDFT của .

Cần chú ý rằng biên độ phổ của tín hiệu đã được tăng cường là , có thể bị âm do sự sai sót trong việc ước lượng phổ của nhiễu. Tuy nhiên, biên độ của phổ thì không thể âm, nên chúng cần phải đảm bảo rằng khi thực trừ hai phổ thì phổ của tín hiệu tăng cường |X()| luôn luôn không âm. Giải pháp được đưa ra để khắc phục điều này là chỉnh lưu bán sóng hiệu của phổ, nếu thành phần phổ nào mà âm thì chúng ta sẽ gán nó bằng 0:

(3.6)

Phương pháp xử lý bằng chỉnh lưu bán sóng là một trong những cách để đảm bảo cho |X()| không bị âm.


1.17.3Spectral subtraction đối với phổ công suất


Thuật toán Spectral subtraction đối với phổ biên độ có thể được mở rộng sang miền phổ công suất. Vì trong một vài trường hợp, nó có thể làm việc tốt với phổ công suất hơn là với phổ biên độ. Lấy phổ công suất của tín hiệu bị nhiễu trong một khoảng ngắn, chúng ta bình phương |Y()|, ta được:

(3.7)

||2, X(). không thể tính được một cách trực tiếp và xấp xỉ bằng E{||2}, E{ X().} và E{}, khi đó E[.] là toán tử kỳ vọng. Bình thường thì E{||2} được ước lượng khi không có tiếng nói hoạt động và được biểu thị là ||2. Nếu chúng ta thừa nhận d[n] = 0 và không có một sự tương quan nào với tín hiệu sạch x[n], thì E{ X().} và E{} xem là 0. Khi đó phổ công suất của tín hiệu sạch có thể tính được như sau



(3.8)

Công thức trên biểu diễn thuật toán trừ phổ công suất. Như công thức trên, thì phổ công suất được ước lượng không được đảm bảo luôn là một số dương, nhưng có thể sử dụng phương pháp chỉnh lưu bán sóng như đã trình bày ở trên. Tín hiệu được tăng cường sẽ thu được bằng cách tính IDFT của (bằng cách lấy căn bậc hai của 2 ), có sử dụng pha của tín hiệu tiếng nói bị nhiễu. Chú ý rằng, nếu chúng ta lấy IDFT cả hai vế của công thức (4.8) trên thì ta có một phương trình tương tự trong miền tự tương quan:



(3.9)

Khi đó , , là các hệ số tự tương quan của tín hiệu sạch, tín hiệu tiếng nói bị nhiễu, và tín hiệu nhiễu đã được ước lượng [23,24].

Công thức (1) có thể được viết theo dạng sau:

( 3.10)

Khi đó: (3.11)

Trong lý thuyết hệ thống tuyến tính, H() là hàm truyền đạt của hệ thống. Trong lý thuyết của Speech enhancement, chúng ta xem H() là hàm độ lợi hay hàm nén. Và H() là một số thực và luôn luôn dương, và có giá trị nàm trong phạm vị . Nếu nó có giá trị âm là do có sai sót trong quá trình ước lượng phổ của nhiễu. H() được gọi là hàm nén là vì nó cho ta biết tỷ số giữa phổ công suất của tín hiệu được tăng cường với phổ công suất của tín hiệu bị nhiễu. Hình dạng của hàm nén là một đặc trưng duy nhất của mỗi thuật toán Speech enhancement.

Chính vì vậy mà chúng ta thường so sánh các thuật toán bằng cách so sánh các đáp ứng của hàm nén của chúng. Hệ số H() có giá trị thực nên biến đổi IDFT là h[n] đối xứng với nhau qua điểm 0 và không nhân quả. Trong miền thời gian thì h[n] được xem là một bộ lọc không nhân quả [25]. Nên sẽ có một phương pháp được đề xuất để hiệu chỉnh hàm H() để đáp ứng của nó trở thành bộ lọc nhân quả trong miền thời gian.

Trường hợp chung thì thuật toán Spectral subtraction có thể được biểu diễn:

(3.12)

Trong đó p là số mũ công suất, với p = 1 là đó là phương pháp trừ phổ biên độ điển hình, p = 2 là phương pháp trừ phổ công suất.

Sơ đồ khối của thuật toán Spectral Subtraction :



Hình 3.2 Sơ đồ khối của thuật toán Spectral subtraction [26].


Каталог: nonghocbucket -> UploadDocument server07 id50526 114188
UploadDocument server07 id50526 114188 -> Trường Đại Học Mỏ Địa Chất Khoa Dầu Khí Lời mở đầu
UploadDocument server07 id50526 114188 -> MỤc lục mở ĐẦU 10 Xuất xứ của dự án 10
UploadDocument server07 id50526 114188 -> Thiết kế MÔn học nhà MÁY ĐIỆn lời nóI ĐẦU
UploadDocument server07 id50526 114188 -> ĐỀ TÀi ngân hàng trung ưƠng trưỜng trung cấp kt-cn đÔng nam
UploadDocument server07 id50526 114188 -> Seminar staphylococcus aureus và những đIỀu cần biếT
UploadDocument server07 id50526 114188 -> Bài thảo luận Đánh giá chất lượng sản phẩm dầu thực vật Môn Phân Tích Thực Phẩm Nhóm 2 : Hoàng – Hùng Hiếu Hồng
UploadDocument server07 id50526 114188 -> Luận văn tốt nghiệp gvhd: pgs. Ts nguyền Ngọc Huyền MỤc lục danh mục các chữ viết tắT
UploadDocument server07 id50526 114188 -> Aïi Hoïc Quoác Gia Tp
UploadDocument server07 id50526 114188 -> Mục lục Tổng quan về thịt
UploadDocument server07 id50526 114188 -> Gvhd: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu cpu

tải về 280.46 Kb.

Chia sẻ với bạn bè của bạn:
1   2   3   4   5   6   7   8   9   10




Cơ sở dữ liệu được bảo vệ bởi bản quyền ©hocday.com 2024
được sử dụng cho việc quản lý

    Quê hương