سجلات المرضى الإلكترونية تحتوي على ثروة من المعلومات غير المهيكلة—ملاحظات الأطباء، تقارير الاستشارة، ووصف الأعراض—التي قد تحمل دلائل حاسمة لتشخيص الأمراض النادرة. تُستخدم تقنيات معالجة اللغة الطبيعية (NLP) لاستخراج الكيانات السريرية، ربط المصطلحات بمصطلحات معيارية مثل HPO (Human Phenotype Ontology)، وتحويل النص الحر إلى سمات قابلة للاستخدام نمذجيًا. يمكن لأنظمة الـNLP أن تكشف عن أنماط تكرارية للأعراض، تتبع تطور المرض عبر الزمن، وتسلط الضوء على اشتباهات سابقة قد أهملت. تواجه التطبيقات مشكلة التغايرية اللغوية بين المراكز الطبية واختلاف صيغ التدوين، مما يتطلب نماذج مرنة وقواعد معجمية واسعة. كما أن حماية الخصوصية والامتثال للقوانين يمثلان تحديًا عند استخدام نصوص حساسة. عند الجمع بين استخراج السمات من النصوص وتحليل البيانات الجينية، يمكن للنماذج تقديم قوائم مرشحة للتشخيص تعزز من قدرة الفريق الطبي على اتخاذ قرارات أفضل.