GPT-4, asistan doktorlardan önemli ölçüde daha yüksek puan aldı.
Araştırmacılar, büyük dil modellerinin doktorların yerini alamayacağını ancak doktorların aynı sürede daha fazla hastaya bakım sunmasını destekleyerek sağlık sistemini iyileştirebileceğini ve bekleme listelerini azaltabileceğini söylüyor.
Yeni yapılan bir araştırmaya göre, ChatGPT'nin arkasındaki teknolojinin, göz sorunları konusunda uzman olmayan doktorlara göre daha iyi tavsiyelerde bulunduğunu gösteriyor.
Araştırmacılar, farklı geçmişlere sahip doktorları adım adım ilerleten şaşırtıcı bir dizi bulgunun ardından, yapay zekanın doktorların yerini alamayacağını ancak araçların NHS bekleme listeleri için yakında bir çözüm olabileceğini söylüyor.
Yeni bir araştırma, ChatGPT'nin arkasındaki teknolojinin, göz sorunlarını değerlendirme ve tavsiye verme konusunda uzman olmayan doktorlara göre daha iyi puan aldığını ortaya çıkardı.
Cambridge Üniversitesi tarafından yürütülen bir araştırma, OpenAI tarafından geliştirilen büyük dil modeli (LLM) GPT-4'ün, yazılı çoktan seçmeli bir testte neredeyse uzman göz doktorları kadar iyi performans gösterdiğini buldu.
Üzerinde eğitim aldığı büyük miktarda veriye dayanarak metin üretmesiyle bilinen yapay zeka modeli, uzmanlık alanı olmayan asistan doktorların yanı sıra stajyer ve uzman göz doktorları da dahil olmak üzere kariyerlerinin farklı aşamalarındaki doktorlara karşı test edildi.
Her gruba, hastaların belirli bir göz problemine sahip olduğu onlarca senaryo sunuldu ve dört seçenekten birini seçerek teşhis koymaları veya tedavi konusunda tavsiyelerde bulunmaları istendi.
Test, stajyer göz doktorlarını test etmek için kullanılan bir ders kitabından alınan, ışığa duyarlılık, görme azalması, lezyonlar ve göz kaşıntısı dahil olmak üzere bir dizi göz problemiyle ilgili yazılı sorulara dayanıyordu.
Soruların dayandığı ders kitabı kamuya açık olmadığından araştırmacılar, büyük dil modelinin içeriğine göre eğitilmiş olmasının pek mümkün olmadığına inanıyor.
GPT-4, asistan doktorlardan önemli ölçüde daha yüksek puan aldı.
Model, stajyer ve uzman göz doktorlarıyla benzer puanlar elde etti ancak en iyi performansı gösteren uzmanlar tarafından geride bırakıldı.
Araştırma geçen yıl mevcut en yeni büyük dil modelleri kullanılarak gerçekleştirildi.
Çalışma aynı zamanda OpenAI modelinin önceki bir sürümü olan GPT-3.5'i, Google'ın PaLM2'sini ve Meta'nın LLaMA'sını aynı soru seti üzerinde test etti. GPT-4 diğer modellerden daha doğru yanıtlar verdi.
Araştırmacılar, büyük dil modellerinin doktorların yerini alamayacağını ancak doktorların aynı sürede daha fazla hastaya bakım sunmasını destekleyerek sağlık sistemini iyileştirebileceğini ve bekleme listelerini azaltabileceğini söyledi.
Makalenin baş yazarı Dr. Arun Thirunavukarasu şunları söyledi: "Eğer insanların sunduğu standartların aynısını sunabilecek modellerimiz olsaydı, bu NHS bekleme listelerindeki sorunların üstesinden gelmeye yardımcı olurdu.
"Güvenli ve etkili bir model olduğundan emin olmak için denemeler yapılması gerekiyor. Ancak eğer öyleyse, bakımın nasıl sunulduğu konusunda devrim niteliğinde olabilir."
Makale yazarı ayrıca şunları ekledi: "Çalışma, yüksek lisansların klinik çalışmalarda hemen kullanıma sunulduğunu göstermese de, uzman oftalmologlarla karşılaştırıldığında bu modellerin bilgisi ve muhakemesi iyi olduğundan, yüksek lisans tabanlı klinik araçların geliştirilmesine başlamaya yeşil ışık veriyor."
Kaynak: https://news.sky.com
İlgili Galeriler