Brzmisz jak chory? Nowa technologia AI może powiedzieć, czy to COVID
By Bill Stieg
Sept. 19, 2022 -- Wyobraź sobie taką sytuację: Myślisz, że możesz mieć COVID. Wypowiadasz kilka zdań do swojego telefonu. Następnie aplikacja podaje Ci wiarygodne wyniki w mniej niż minutę.
My, ludzie, możemy powiedzieć przyjacielowi: "Brzmisz jak chory". Sztuczna inteligencja, czyli AI, mogłaby przenieść to na nowe tory, analizując Twój głos w celu wykrycia infekcji COVID.
Niedroga i prosta aplikacja mogłaby być wykorzystywana w krajach o niskich dochodach lub do kontroli tłumów na koncertach i innych dużych zgromadzeniach, twierdzą naukowcy.
To tylko najnowszy przykład w rosnącym trendzie badającym głos jako narzędzie diagnostyczne do wykrywania lub przewidywania chorób.
W ciągu ostatniej dekady analiza mowy AI okazała się pomocna w wykrywaniu choroby Parkinsona, zespołu stresu pourazowego, demencji i chorób serca. Badania są tak obiecujące, że Narodowe Instytuty Zdrowia rozpoczęły właśnie nową inicjatywę mającą na celu rozwój sztucznej inteligencji w celu wykorzystania głosu do diagnozowania szerokiego zakresu schorzeń. Począwszy od dolegliwości układu oddechowego, takich jak zapalenie płuc i POChP, po raka krtani, a nawet udar mózgu, ALS i zaburzenia psychiczne, takie jak depresja i schizofrenia. Oprogramowanie może wykryć niuanse, których ludzkie ucho nie jest w stanie wykryć, twierdzą naukowcy.
Co najmniej pół tuzina badań przyjęło takie podejście do wykrywania COVID. W najnowszym postępie badacze z Uniwersytetu Maastricht w Holandii informują, że ich model AI był dokładny w 89% czasu, w porównaniu ze średnią 56% dla różnych testów przepływu bocznego. Test głosowy był również dokładniejszy w wykrywaniu infekcji u osób nie wykazujących objawów.
Jedna przeszkoda: Testy przepływu bocznego wykazują fałszywie pozytywne wyniki w mniej niż 1% czasu, w porównaniu z 17% dla testu głosowego. Mimo to, ponieważ test jest "praktycznie darmowy", nadal byłoby praktyczne, aby ci, którzy mają pozytywny wynik, wykonywali dalsze testy, powiedział badacz Wafaa Aljbawi, który przedstawił wstępne wyniki na Międzynarodowym Kongresie Europejskiego Towarzystwa Oddechowego w Barcelonie, w Hiszpanii.
"Osobiście jestem podekscytowana możliwymi implikacjami medycznymi" - mówi dr Visara Urovi, badaczka w projekcie i profesor nadzwyczajny w Instytucie Nauki o Danych na Uniwersytecie w Maastricht. "Jeśli lepiej zrozumiemy, jak głos zmienia się z różnymi warunkami, moglibyśmy potencjalnie wiedzieć, kiedy jesteśmy bliscy zachorowania lub kiedy szukać więcej testów i/lub leczenia".
Opracowanie SI
Infekcja COVID może zmienić twój głos. Wpływa na drogi oddechowe, "powodując brak energii mowy i utratę głosu z powodu duszności i zatłoczenia górnych dróg oddechowych", mówi papier preprint, który nie został jeszcze poddany recenzji. Typowy dla pacjenta COVID suchy kaszel również powoduje zmiany w strunach głosowych. A poprzednie badania wykazały, że dysfunkcja płuc i krtani spowodowana COVID zmienia charakterystykę akustyczną głosu.
Częścią tego, co czyni najnowsze badania godnymi uwagi, jest wielkość zbioru danych. Naukowcy wykorzystali bazę danych z Uniwersytetu w Cambridge, która zawierała 893 próbki dźwiękowe od 4 352 osób, z których 308 miało pozytywny wynik testu na obecność COVID.
Możesz wnieść swój wkład do tej bazy danych - wszystko jest anonimowe - poprzez aplikację COVID-19 Sounds App, która prosi Cię o trzykrotne kaszlnięcie, głębokie oddychanie przez usta od trzech do pięciu razy i trzykrotne przeczytanie krótkiego zdania.
W swoim badaniu naukowcy z Uniwersytetu w Maastricht "skupili się tylko na zdaniach mówionych", wyjaśnia Urovi. Parametry sygnału" audio "dostarczają pewnych informacji na temat energii mowy", mówi. "To właśnie te liczby są wykorzystywane w algorytmie do podjęcia decyzji".
Audiofile mogą uznać za interesujące, że badacze wykorzystali analizę spektrogramu melowego do identyfikacji cech fali dźwiękowej (lub tembru). Entuzjaści sztucznej inteligencji zauważą, że w badaniu stwierdzono, że pamięć długotrwała krótkotrwała (LSTM) była typem modelu AI, który działał najlepiej. Jest ona oparta na sieciach neuronowych, które naśladują ludzki mózg i jest szczególnie dobra w modelowaniu sygnałów zebranych w czasie.
Dla laików wystarczy wiedzieć, że postępy w tej dziedzinie mogą prowadzić do "niezawodnych, skutecznych, przystępnych cenowo, wygodnych i prostych w użyciu" technologii wykrywania i przewidywania chorób, napisano w artykule.
Co dalej?
Przekształcenie tych badań w sensowną aplikację będzie wymagało udanej fazy walidacji, mówi Urovi. Taka "zewnętrzna walidacja" -- testowanie jak model działa z innym zestawem dźwięków -- może być powolnym procesem.
"Faza walidacji może trwać lata, zanim aplikacja zostanie udostępniona szerszej publiczności" - mówi Urovi.
Urovi podkreśla, że nawet z dużym zbiorem danych Cambridge, "trudno jest przewidzieć, jak dobrze ten model może działać w populacji ogólnej." Jeśli okaże się, że badanie mowy działa lepiej niż szybki test antygenowy, "ludzie mogą preferować tanią nieinwazyjną opcję".
"Ale potrzeba więcej badań badających, które cechy głosu są najbardziej przydatne w wybieraniu przypadków COVID, i aby upewnić się, że modele mogą odróżnić COVID od innych chorób układu oddechowego" - czytamy w artykule.
Czy testy aplikacji przedkoncertowych są w naszej przyszłości? To będzie zależało od analizy kosztów i korzyści oraz wielu innych czynników, mówi Urovi.
Niemniej jednak, "może nadal przynieść korzyści, jeśli test jest używany jako wsparcie lub dodatek do innych dobrze ugruntowanych narzędzi przesiewowych, takich jak test PCR."