Szövegbányászat R-ben: Egy 10 alkalmas kurzus
Ezen az oldalon ízelítőt adunk a szövegbányászat kutatási alkalmazásaiból. A 10 alkalmas kurzus bevezetést nyújt az R-ben végrehajtott szövegbányászati és gépi tanulási feladatokba. A feladatok elvégzéséhez a Hungarian Comparative Agendas Project korpuszait használjuk. A kurzus elvégzéséhez fontos az R és az RStudio minimális ismerete. A telepítésről további információ itt. Az R-ről itt, az RStudio-ról pedig itt található egy rövid leírás.
ÁTTEKINTÉS
1. Mi a szövegbányászat? A szöveg mint adat
2. A korpusz-készítés és előkészítés problémái
3. Egyszerű leíró statisztikák: szózsák, együttes megjelenés
5. Osztályozás: érzelem-felismerés
6. Osztályozás: további szótár-alapú feladatok
7. Osztályozás: felügyelt tanulás
8. Csoportosítás: klaszter-elemzés