^

Νέες δημοσιεύσεις

A
A
A

Φωνή ως Ανάλυση: Πρώιμα Σημάδια Καρκίνου και Καλοήθων Βλαβών

 
Alexey Kryvenko, Ιατρικός Κριτής
Τελευταία επισκόπηση: 18.08.2025
 
Fact-checked
х

Όλα τα περιεχόμενα του iLive ελέγχονται ιατρικά ή ελέγχονται για να διασφαλιστεί η όσο το δυνατόν ακριβέστερη ακρίβεια.

Έχουμε αυστηρές κατευθυντήριες γραμμές προμήθειας και συνδέουμε μόνο με αξιόπιστους δικτυακούς τόπους πολυμέσων, ακαδημαϊκά ερευνητικά ιδρύματα και, όπου είναι δυνατόν, ιατρικά επισκοπικά μελέτες. Σημειώστε ότι οι αριθμοί στις παρενθέσεις ([1], [2], κλπ.) Είναι σύνδεσμοι με τις οποίες μπορείτε να κάνετε κλικ σε αυτές τις μελέτες.

Εάν πιστεύετε ότι κάποιο από το περιεχόμενό μας είναι ανακριβές, παρωχημένο ή αμφισβητήσιμο, παρακαλώ επιλέξτε το και πατήστε Ctrl + Enter.

12 August 2025, 08:13

Ερευνητές από το Πανεπιστήμιο Υγείας και Επιστημών του Όρεγκον ανέλυσαν ηχογραφήσεις ομιλίας από το νέο, δημόσια διαθέσιμο σύνολο δεδομένων Bridge2AI-Voice και βρήκαν ένα απλό ακουστικό χαρακτηριστικό που μπορεί να αποκαλύψει παθολογία των φωνητικών χορδών. Μιλάμε για την αναλογία αρμονικών προς θόρυβο (HNR) — την αναλογία των «μουσικών αρμονικών» προς τον θόρυβο. Το επίπεδο και η μεταβλητότητά της διέκρινε τις φωνές των ατόμων με καρκίνο του λάρυγγα και καλοήθεις αλλοιώσεις από τις υγιείς και ορισμένες άλλες φωνητικές διαταραχές. Το αποτέλεσμα ήταν ιδιαίτερα εμφανές στους cis άνδρες. Η στατιστική σημαντικότητα δεν ήταν αρκετή για τις γυναίκες — οι συγγραφείς αποδίδουν το μικρό μέγεθος του δείγματος και ζητούν επέκταση των δεδομένων. Η εργασία δημοσιεύθηκε ως σύντομη έκθεση στο Frontiers in Digital Health.

Ιστορικό της μελέτης

  • Γιατί να ψάχνουμε για «φωνητικούς δείκτες». Η βραχνάδα είναι ένα συνηθισμένο παράπονο. Οι αιτίες ποικίλλουν: από κρυολογήματα και παλινδρόμηση έως οζίδια/πολύποδες και καρκίνο του λάρυγγα. Προς το παρόν, η οδός για τη διάγνωση είναι η επίσκεψη σε έναν ΩΡΛ και μια ενδοσκόπηση (μια κάμερα στη μύτη/λαιμό). Είναι ακριβής, αλλά δεν είναι πάντα άμεσα διαθέσιμη και δεν είναι κατάλληλη για αυτοπαρακολούθηση στο σπίτι. Απαιτείται προκαταρκτικός έλεγχος: ένας απλός τρόπος για να κατανοήσουμε ποιος πρέπει να δει πρώτα έναν γιατρό.
  • Τι είναι ένας βιοδείκτης φωνής; Η ομιλία είναι ένα σήμα που μπορεί εύκολα να καταγραφεί σε ένα τηλέφωνο. Το «πρότυπο» του μπορεί να χρησιμοποιηθεί για να κρίνουμε πώς δονούνται οι φωνητικές χορδές. Οι βλάβες κάνουν τις δονήσεις ανομοιόμορφες: περισσότερος «θόρυβος» και λιγότερη «μουσική».
  • Γιατί είναι σημαντικά τα νέα σύνολα δεδομένων. Προηγουμένως, τέτοιες εργασίες βασίζονταν σε μικρά, «αυτοσχέδια» δείγματα — τα μοντέλα ήταν εύθραυστα. Το Bridge2AI-Voice είναι ένα μεγάλο, πολυκεντρικό, ηθικά συλλεγμένο σύνολο ηχογραφήσεων που συνδέονται με διαγνώσεις. Δημιουργήθηκε ως «κοινό πεδίο δοκιμών» για την επιτέλους εκπαίδευση και δοκιμή αλγορίθμων σε μεγάλα και ετερογενή δεδομένα.
  • Πού είναι οι κύριες δυσκολίες;
    • Η φωνή αλλάζει λόγω του μικροφώνου, του θορύβου του δωματίου, του κρύου, του καπνίσματος, της γλώσσας, του φύλου και της ηλικίας.
    • Παραδοσιακά, υπάρχουν λιγότερα γυναικεία δεδομένα και η γυναικεία φωνή έχει υψηλότερη συχνότητα - οι μετρήσεις συμπεριφέρονται διαφορετικά.
    • Καμία «οικιακή» εξέταση δεν μπορεί να αντικαταστήσει μια εξέταση ή να κάνει μια διάγνωση - το πολύ-πολύ, βοηθάει να αποφασίσετε: «είναι απαραίτητο να δείτε επειγόντως έναν ειδικό ΩΡΛ;»
  • Γιατί το χρειάζονται αυτό η κλινική και οι ασθενείς; Εάν άτομα με υψηλό κίνδυνο εμφάνισης λεμφαδένων/όγκων μπορούν να επιλεγούν για ραντεβού προτεραιότητας με σύντομο ραντεβού, αυτό θα επιταχύνει τη διάγνωση, θα μειώσει τις περιττές παραπομπές και θα παρέχει ένα εργαλείο για αυτοπαρακολούθηση μεταξύ των επισκέψεων (μετά την επέμβαση, κατά τη διάρκεια της θεραπείας).
  • Πού θα πρέπει να οδηγήσει αυτό: Σε επικυρωμένες εφαρμογές/μονάδες τηλεϊατρικής που:
    1. γράψτε μια ομιλία σύμφωνα με το πρότυπο (φράση + παρατεταμένο «ααα»),
    2. υπολογίζει βασικά χαρακτηριστικά (HNR, jitter, shimmer, F0),
    3. εκδώστε σύσταση για επικοινωνία με έναν ειδικό εάν το προφίλ είναι ανησυχητικό,
    4. διατηρήστε τη δυναμική μετά τη θεραπεία.

Η ιδέα είναι απλή: «δώστε το τηλέφωνο στο αυτί ενός ΩΡΛ γιατρού» – όχι για διάγνωση, αλλά για να μην χάσετε όσους χρειάζονται γρήγορη βοήθεια πρόσωπο με πρόσωπο.

Τι ακριβώς έκαναν;

  • Πήραμε την πρώτη έκδοση του πολυκεντρικού, ηθικά συλλεγμένου συνόλου δεδομένων Bridge2AI-Voice, ενός εμβληματικού έργου των NIH όπου οι φωνητικές ηχογραφήσεις συνδέονται με κλινικές πληροφορίες (διαγνώσεις, ερωτηματολόγια κ.λπ.).
  • Σχηματίστηκαν δύο αναλυτικά δείγματα:
    1. «καρκίνος του λάρυγγα / καλοήθεις λεμφαδένες / υγιείς»;
    2. «καρκίνος ή καλοήθη οζίδια» έναντι σπασμωδικής δυσφωνίας και παράλυσης φωνητικών χορδών (άλλες συχνές αιτίες βραχνάδας).
  • Βασικά φωνητικά χαρακτηριστικά προσδιορίστηκαν από τυποποιημένες φράσεις: θεμελιώδης τόνος (F0), τρέμουλο, λάμψη και HNR, και οι ομάδες συγκρίθηκαν χρησιμοποιώντας μη παραμετρικά στατιστικά στοιχεία. Αποτέλεσμα: οι πιο σταθερές διαφορές ήταν στο HNR και στο F0, με το HNR και τη μεταβλητότητά του να διαχωρίζουν καλύτερα τις καλοήθεις αλλοιώσεις τόσο από τον φυσιολογικό όσο και από τον καρκίνο του λάρυγγα. Αυτά τα σήματα ήταν πιο διακριτά στους άνδρες.

Γιατί είναι αυτό σημαντικό;

  • Πρώιμος έλεγχος χωρίς καθετήρα. Προς το παρόν, η οδός προς τη διάγνωση συχνά σημαίνει ρινοενδοσκόπηση και, σε περίπτωση υποψίας, βιοψία. Εάν τα απλά ακουστικά χαρακτηριστικά σε συνδυασμό με την τεχνητή νοημοσύνη μπορούν να δώσουν προτεραιότητα σε όσους χρειάζονται ενδοσκόπηση, οι ασθενείς θα απευθύνονται σε έναν ΩΡΛ ιατρό νωρίτερα και οι περιττές παραπομπές θα μειωθούν. Αυτό αποτελεί συμπλήρωμα, όχι αντικατάσταση του γιατρού.
  • Μεγάλα δεδομένα για φωνή. Το Bridge2AI-Voice είναι ένα σπάνιο έργο όπου η φωνή συλλέγεται χρησιμοποιώντας ομοιόμορφα πρωτόκολλα και συνδέεται με διαγνώσεις. Τα δεδομένα είναι διαθέσιμα στους ερευνητές μέσω του PhysioNet / Health Data Nexus. Αυτό επιταχύνει την ανάπτυξη αξιόπιστων φωνητικών βιοδεικτών αντί για «θαυματουργές εφαρμογές» σε μικρά δείγματα.

Τι είναι το HNR;

Όταν μιλάμε, οι φωνητικές χορδές δονούνται και δημιουργούν αρμονικές. Αλλά η δόνηση δεν είναι ποτέ τέλεια - υπάρχει πάντα θόρυβος στο σήμα. Το HNR είναι απλώς το πόσο περισσότερη «μουσική» υπάρχει στη φωνή παρά «σφύριγμα». Όταν οι χορδές έχουν υποστεί ζημιά, η δόνηση γίνεται λιγότερο ομοιόμορφη - υπάρχει περισσότερος θόρυβος, το HNR μειώνεται και τα άλματα (μεταβλητότητά) του αυξάνονται. Αυτό είναι το μοτίβο που έπιασαν οι συγγραφείς.

Σημαντικές Αποποιήσεις Ευθύνης

  • Πρόκειται για μια πιλοτική, διερευνητική ανάλυση: χωρίς κλινική επικύρωση, με περιορισμούς στο δείγμα γυναικών - επομένως οι επιπτώσεις τους δεν ήταν σημαντικές. Απαιτούνται μεγαλύτερα και πιο ποικίλα δεδομένα και «ψήσιμο» μοντέλων σε διαφορετικές κλινικές και σε διαφορετικές γλώσσες.
  • Η φωνή είναι κάτι «πολυτιμό»: επηρεάζεται από ένα κρυολόγημα, το κάπνισμα, την παλινδρόμηση, ένα μικρόφωνο, τον θόρυβο στο δωμάτιο. Οποιαδήποτε «κατ' οίκον εξέταση» θα πρέπει να μπορεί να λαμβάνει υπόψη το πλαίσιο - και να χρησιμεύει ως φίλτρο για παραπομπή σε έναν ΩΡΛ και όχι ως διάγνωση με ένα κλικ.

Τι ακολουθεί;

  • Επεκτείνετε το σύνολο δεδομένων (συμπεριλαμβανομένων και των δεδομένων για γυναίκες και ηλικίες), τυποποιήστε τις εργασίες και την ακουστική (ανάγνωση μιας φράσης, παρατεταμένο «ααα» κ.λπ.), δοκιμάστε πολυτροπικά μοντέλα (φωνή + συμπτώματα/παράγοντες κινδύνου ερωτηματολογίου).
  • Συνδέστε τα ακουστικά σημάδια με τα αποτελέσματα των εξετάσεων (ενδοσκόπηση, στροβοσκόπηση) και τη δυναμική μετά τη θεραπεία - έτσι ώστε το προφίλ HNR να μπορεί επίσης να χρησιμοποιηθεί για παρακολούθηση.
  • Συνέχεια της «ανοιχτής επιστήμης»: Το Bridge2AI-Voice δημοσιεύει ήδη εκδόσεις του συνόλου δεδομένων και των εργαλείων - αυτή είναι μια ευκαιρία να προσεγγίσουμε γρήγορα πραγματικούς πιλότους σε κλινικές.

Σύναψη

Είναι πιθανό να «ακούσουμε» προβλήματα στις φωνητικές χορδές από τη φωνή — και ίσως να παραπέμψουμε το άτομο στον κατάλληλο ειδικό νωρίτερα. Προς το παρόν, είναι μια αρκετά καλή ένδειξη (η HNR και η μεταβλητότητά της), αλλά χάρη στα μεγάλα ανοιχτά δεδομένα, οι φωνητικοί βιοδείκτες έχουν επιτέλους την ευκαιρία να γίνουν ένα αξιόπιστο εργαλείο διαλογής.

Πηγή: Jenkins P. et al. Η φωνή ως βιοδείκτης: Διερευνητική ανάλυση για καλοήθεις και κακοήθεις αλλοιώσεις φωνητικών χορδών. Frontiers in Digital Health, 2025 (έγινε δεκτό για δημοσίευση). Δεδομένα — Bridge2AI-Voice (NIH/PhysioNet).

You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.