Tárgy :Adatelemzés
Téma :Termékértékelések hangulatelemzése
Célkitűzés :Ennek a feladatnak az a célja, hogy véleményelemzést végezzen a termékértékeléseken, hogy meghatározza a véleményezőnek a termékkel kapcsolatos véleményét.
Utasítások :
1. Adatok előkészítése :
- Gyűjtsön össze egy megfelelő forrásból (pl. Amazon, Yelp) származó termékismertetőket.
- Tisztítsa meg az adatokat az ismétlődő vélemények eltávolításával, a hiányzó értékek kezelésével és a szöveg kisbetűssé alakításával.
2. Feltáró adatelemzés :
- Fedezze fel az adatokat, hogy megértse jellemzőit és eloszlását.
- Végezzen alapvető statisztikákat, például gyakoriságszámlálást és szófelhőket, hogy azonosítsa a véleményekben használt gyakori szavakat és kifejezéseket.
3. Érzelemelemzés :
- Használjon megfelelő hangulatelemző könyvtárat vagy eszközt (pl. TextBlob, VADER vagy spaCy), hogy minden véleményhez hangulatpontszámot rendeljen.
- Csoportosítsa a véleményeket pozitív, negatív vagy semleges kategóriákba a hangulati pontszámuk alapján.
4. Feature Engineering :
- Vonja ki a véleményekből azokat a releváns elemeket, amelyek hozzájárulhatnak a hangulathoz. Ezek közé tartozhatnak a szavak gyakorisága, írásjelek vagy más NLP-vel kapcsolatos jellemzők.
5. Gépi tanulási modell :
- Felügyelt gépi tanulási modell kidolgozása a vélemények pozitív vagy negatív minősítésére.
- Tanítsa meg a modellt a címkézett adatokra, és értékelje ki a teljesítményét megfelelő mérőszámok (pl. pontosság, precizitás, visszahívás és F1-pontszám) segítségével.
6. A modell értelmezése :
- Vizualizálja a modell előrejelzéseit zavaros mátrixok vagy más releváns vizualizációk segítségével.
- Elemezze a rosszul besorolt értékeléseket a fejlesztésre szoruló területek azonosítása érdekében.
7. Jelentéskészítés :
- Készítsen jelentést, amely összefoglalja a hangulatelemzés eredményeit.
- Tartalmazzon részleteket az adat-előkészítésről, a feltáró adatelemzésről, a jellemzők tervezéséről, a modellképzésről és az értékelési eredményekről.
Benyújtás :
- Küldje be a következőket:
- A kódot és az elemzést tartalmazó Jupyter Notebook vagy Python szkript.
- Az eredményeket összefoglaló PDF jelentés.
Határidő :
- A megbízás esedékessége [dátum].
- A késedelmes benyújtásért napi 10% büntetés jár.