MỘT công việc hợp tác giữa các nhà thần kinh học, bác sĩ phẫu thuật thần kinh và kỹ sư của Duke đã dẫn đến sự phát triển của một bộ phận giả giọng nói mới có khả năng chuyển tín hiệu não thành lời nói mạch lạc.
Sự đổi mới này có tiềm năng cho các cá nhân đang phải đối mặt với những thách thức về giao tiếp do rối loạn thần kinh, mang đến một con đường đầy hứa hẹn thông qua giao diện não-máy tính.

(Ảnh: Abhishek Kumar Biswas từ Pixabay)
Cảm biến não linh hoạt, mật độ cao
Gregory Cogan, Tiến sĩ, giáo sư thần kinh học tại Trường Y thuộc Đại học Duke và là nhân vật chủ chốt trong liên doanh này, nhấn mạnh tầm quan trọng của công nghệ này đối với những cá nhân đang đối phó với các tình trạng như ALS hoặc hội chứng nhốt.
Ông nhấn mạnh những hạn chế hiện tại của các công cụ giao tiếp có xu hướng chậm và khó sử dụng. Hiện nay, công nghệ giải mã giọng nói hoạt động với tốc độ tương đương một nửa tốc độ của một cuốn sách nói, xấp xỉ 78 từ/phút.
Ngược lại, tốc độ nói trung bình của con người là khoảng 150 từ mỗi phút. Độ trễ này một phần xuất phát từ số lượng hạn chế các cảm biến hoạt động của não có thể được tích hợp vào một vật liệu siêu mỏng đặt trên bề mặt não.
Theo các nhà nghiên cứu, sự khan hiếm của các cảm biến dẫn đến thông tin có sẵn để giải mã ít toàn diện hơn. Để giải quyết vấn đề này, Cogan đã hợp tác với Tiến sĩ Jonathan Viventi, một giảng viên tại Viện Khoa học Não Duke chuyên tạo ra các cảm biến não linh hoạt, mật độ cao.
Trong dự án này, nhóm của Viventi đã cố gắng kết hợp ấn tượng 256 cảm biến não cực nhỏ lên một chất nền nhựa cấp y tế có kích thước bằng con tem bưu chính. Mật độ cảm biến này cho phép phân biệt tín hiệu từ các tế bào não lân cận, một khía cạnh quan trọng để dự đoán chính xác về lời nói dự định.
Sau đó, các nhà nghiên cứu hợp tác với các bác sĩ giải phẫu thần kinh từ Bệnh viện Đại học Duke, bao gồm Derek Southwell, MD, PhD; Nandan Lad, MD, Tiến sĩ; và Allan Friedman, MD, để tiến hành xét nghiệm trên bốn bệnh nhân. Những thử nghiệm này liên quan đến việc cấy ghép tạm thời thiết bị vào những người đang trải qua phẫu thuật não vì các tình trạng khác.
Hoạt động nghe và lặp lại
Những người tham gia tham gia vào hoạt động nghe và lặp lại, nghe và sau đó nói một loạt từ vô nghĩa. Thiết bị ghi lại hoạt động từ vỏ não vận động lời nói của bệnh nhân, nơi điều phối chuyển động của các cơ khác nhau liên quan đến việc tạo ra lời nói.
Sau đó, Suseendrakumar Duraivel, một sinh viên tốt nghiệp ngành kỹ thuật y sinh tại Duke và là tác giả chính của nghiên cứu, đã xử lý dữ liệu thần kinh và giọng nói bằng thuật toán học máy. Thuật toán này nhằm mục đích dự đoán âm thanh được tạo ra chỉ dựa trên bản ghi hoạt động của não.
Kết quả cho thấy độ chính xác 84% đối với một số âm thanh nhất định khi chúng là âm thanh đầu tiên trong chuỗi ba âm thanh tạo thành một từ vô nghĩa nhất định. Tuy nhiên, độ chính xác giảm đi đối với các âm ở giữa hoặc cuối một từ, đặc biệt khi các âm tương tự nhau, chẳng hạn như /p/ và /b/.
Tổng cộng, bộ giải mã đạt được độ chính xác 40%, một thành tích ấn tượng khi nó hoạt động chỉ với 90 giây dữ liệu giọng nói trong bài kiểm tra kéo dài 15 phút. Nhóm hiện đang theo đuổi phiên bản không dây của thiết bị với khoản tài trợ 2,4 triệu USD từ Viện Y tế Quốc gia.
Mặc dù công nghệ này cho thấy tiềm năng đáng kể nhưng người ta thừa nhận rằng vẫn còn phải tiến bộ trước khi nó có thể được tiếp cận rộng rãi.
Viventi lưu ý rằng tốc độ giải mã giọng nói hiện tại vẫn chậm hơn so với giọng nói tự nhiên nhưng dự kiến sẽ có hướng cải thiện trong tương lai. Những phát hiện của nghiên cứu đã được phát hành trên tạp chí Truyền thông Tự nhiên.

ⓒ 2023 TECHTIMES.com Mọi quyền được bảo lưu. Không sao chép mà không được phép.