A análise de sentimento (ou análise de sentimento) é uma das tarefas com que os especialistas em Data Science trabalham. Com a ajuda dessa análise, você pode estudar a matriz de mensagens e outros dados e determinar como eles são emocionalmente coloridos - positivos, negativos ou neutros.
Vamos ver como funciona - vamos analisar vários artigos com base no conjunto de dados Linis Crowd. Propomos determinar quais modelos são mais promissores, por exemplo, para o desenvolvimento de vários serviços de monitoramento. Como área temática, iremos selecionar artigos de natureza técnica (por exemplo, sobre o Habré), que podem ser úteis para implementar a recolha automática de pareceres.
Tonalidade é a identificação de vocabulário emocionalmente colorido nos textos, bem como uma avaliação emocional das opiniões expressas pelos autores.
, , “” . , ( ). – , , .
, -. , , .
: . – 70-80%, , .
:
. () . , .
, . . , , .
, . – . , IT- , . :
-1 –
0 – ;
1 – ;
2 :
. , , Linis Crowd.
, . python, .
– , .
1)
, , , , . , . .
, :
alpha = 0.3; fitprior = True; classprior = None
2)
, .
:
samplesize, . , .
max_features ( — ).
( ). , , ( ). , , , .
, :
nestimators = 200; maxdepth = 3; random_state = 0
3)
Embedding, 64- , LSTM (128 ) Dense (10 ).
Linis Crowd, 29 – . .
.
, . fasttext , 5 - 10 CPU. GPU 0.7 – 1.
:
– 60%.
– 20%
– 20% .
, 70-80%.
:
(88,32%)
(78,91%)
. RNN (83,26%)
, – 88,32% – . , 80%, .
! , .
-, :
http://datareview.info/article/analiz-tonalnosti-teksta-kontseptsiya-metodyi-oblasti-primeneniya/
https://habr.com/ru/company/palitrumlab/blog/262595/
https://compress.ru/article.aspx?id=23115
https://habr.com/ru/company/mailru/blog/417767/
https://habr.com/ru/company/mailru/blog/516214/
https://habr.com/ru/company/mailru/blog/516726/
https://habr.com/ru/company/mailru/blog/516730/