Tạp chí Công Thương - Các kết quả nghiên cứu

Article detail

Article detail description

Home
Quản trị - Quản lý Issue:

Phân loại người dùng có dấu hiệu ADHD từ ngôn ngữ mạng xã hội: so sánh TF-IDF và DistilBERT

Thị Vi Hài Nguyễn: Trường Đại học Công nghệ Thành phố Hồ Chí Minh; Thị Huyền Trang Nguyễn: Trường Đại học Công Thương Thành phố Hồ Chí Minh;
doi:10.62831/202608011

Abstract

Nghiên cứu khảo sát khả năng nhận diện người dùng có dấu hiệu rối loạn tăng động giảm chú ý (ADHD) thông qua ngôn ngữ trên mạng xã hội. Dữ liệu được lấy từ bộ Twitter-STMHD và xử lý ở mức người dùng, với 1.999 mẫu sau tiền xử lý. Trên tập dữ liệu này, nghiên cứu so sánh 3 mô hình gồm: Logistic Regression, Linear SVM và DistilBERT. Kết quả cho thấy, cả 3 mô hình đều phân biệt được 2 nhóm ADHD và đối chứng, trong đó Linear SVM đạt hiệu quả cao nhất với Accuracy 0.8733 và F1-score 0.8812. Kết quả gợi ý tín hiệu ngôn ngữ trên mạng xã hội có thể hỗ trợ sàng lọc ADHD, nhưng không thay thế chẩn đoán lâm sàng.

Keywords
ADHD ngôn ngữ mạng xã hội TF-IDF DistilBERT Linear SVM phân loại người dùng+

References

1.
[1] Polanczyk G., de Lima M. S., Horta B. L. et al. (2007). The worldwide prevalence of ADHD: A systematic review and metaregression analysis. American Journal of Psychiatry, 164(6), 942–-948.
2.
[2] Thomas R., Sanders S., Doust J. et al. (2015). Prevalence of attention-deficit/hyperactivity disorder: A systematic review and meta-analysis. Pediatrics, 135(4), e994–-e1001. DOI: 10.1542/peds.2014-3482.
3.
[3] Kessler R. C., Adler L., Barkley R. et al. (2006). The prevalence and correlates of adult ADHD in the United States: Results from the National Comorbidity Survey Replication. American Journal of Psychiatry, 163(4), 716–-723. DOI: 10.1176/appi.ajp.163.4.716.
4.
[4] Beyens I., Valkenburg P. M. (2022). Children’s media use and its relation to attention, hyperactivity, and impulsivity. In D. Lemish (Ed.), The Routledge international handbook of children, adolescents, and media (2nd ed., pp. 202–210). Routledge. DOI: 10.4324/9781003118824-26.
5.
[5] Ra C. K., Cho J., Stone M. D. et al. (2018). Association of digital media use with subsequent symptoms of attention-deficit/hyperactivity disorder among adolescents. JAMA, 320(3), 255–-263. DOI: 10.1001/jama.2018.8931.
6.
[6] Chancellor S., De Choudhury M. (2020). Methods in predictive techniques for mental health status on social media: A critical review. NPJ Digital Medicine, 3, Article 43. DOI: 10.1038/s41746-020-0233-7.
7.
[7] Resnik P., Armstrong W., Claudino L. et al. (2015). Beyond LDA: Exploring supervised topic modeling for depression-related language in Twitter. In Proceedings of the 2nd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (pp. 99–-107). Association for Computational Linguistics.
8.
[8] Devlin J., Chang M. W., Lee K. et al. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding [Preprint]. arXiv.
9.
[9] Bokolo B. G., Liu Q. (2023). Deep learning-based depression detection from social media: Comparative evaluation of ML and transformer techniques. Electronics, 12(21), 4396. DOI: 10.3390/electronics12214396.
10.
[10] Suhavi Singh, A. K. Arora U. et al. (2022). Twitter-STMHD: An extensive user-level database of multiple mental health disorders. Proceedings of the International AAAI Conference on Web and Social Media, 16, 1182–-1191.
11.
[11] Kalantari N., Payandeh A., Zampieri M. et al. (2023). Understanding the language of ADHD and autism communities on social media. In 2023 IEEE International Conference on Big Data (BigData) (pp. 2188–-2195). IEEE. DOI: 10.1109/BigData59044.2023.10386833.
12.
[12] Wiechmann D., Kempa E., Kerz E., et al. (2024). Transparent but powerful: Explainability, accuracy, and generalizability in ADHD detection from social media data [Preprint]. arXiv.

Files

Banner quảng cáo