نظرکاوی یکی از زیربخشهای متنکاوی است. در این حوزه به بررسی متنهای نظرمند پرداخته میشود و هدف تشخیص مثبت و یا منفی بودن مفهوم این متنها است. روشها و راهحلهای پیشنهادی در این حوزه به دو دسته باناظر و بدون ناظر دستهبندی میشود. از آنجا که روشهای باناظر کارایی و دقت بالاتری نسبت به روشهای بدون ناظر دارد، سعی میشود تا آنجایی که امکان دارد شرایط برای استفاده از روشهای باناظر فراهم شود. اصلیترین نیازمندی این روشها، دادههای برچسبخورده، به عنوان داده آموزش، در دامنه و زبان دادههای آزمون است. وجود چنین دادههایی در تمام جفت دامنه و زبانها محدودیتی برای استفاده از این گونه روشها محسوب میشود. با توجه به زمانبر و پرهزینه بودن تولید دادههای برچسبخورده به عنوان دادههای آموزش، معمولاً ایجاد چنین مجموعه دادهای به عنوان بهترین راهحل در نظر گرفته نمیشود. همچنین به دلیل بیان متفاوتی که در دامنهها و زبانهای متفاوت وجود دارد، استفاده از دادههای آموزش موجود در دامنه و یا زبان متفاوت به طور مستقیم موجب کاهش کارایی روشها میشود. اما وجود دادههای آموزش در اکثر دامنهها در زبانهای با منابع غنی انگیزهای برای استفاده غیرمستقیم از این دادهها برای نظرکاوی دادههای آزمون در زبانهای دیگر ایجاد میکند. از این رو روشهایی به عنوان روشهای بینزبانی ارائه شد که در آنها از دادههای آموزش موجود در زبان متفاوت با دادههای آزمون، برای استخراج اطلاعات و در نهایت انتقال اطلاعات به زبان مورد نظر، بهره میبرد. در این مقاله روشی برای نظرکاوی بینزبانی ارائه میشود که این استخراج و انتقال اطلاعات با کیفیت بالایی انجام میشود و همچنین برای اکثر زبانها، حتی زبانهای منابعمحدود نیز قابل استفاده میباشد و به منابع موجود در زبان مورد نظر وابستگی کمی دارد. این روش با استفاده از دادههای بدون برچسب در هر دو زبان مبدأ و مقصد، یک گراف دوبخشی بین دو دسته از ویژگیهای محوری و غیرمحوری میسازد و ویژگیهای معنایی را از آن استخراج میکند. تنها منبع مورد نیاز برای این روش، یک لغتنامه است که به دلیل استفاده از تعداد محدودی از ترجمههای آن، میزان وابستگی بالایی به این منبع ندارد.
[1] P. D. Turney, "Thumbs Upor Thumbs Down? SemanticOrientation Applied to Unsupervised Classification of Reviews,"
Proc. Annu. Meet. ACL, 2002.
[2] B. Pang, L. Lee, and S. Vaithyanathan, "Thumbs Up?:Sentiment Classification UsingMachine Learning Techniques,"
Proc. Conf. EMNLP, 2002.
[3] D. Tang, and et. al., "Sentiment Embeddings with Applicationsto Sentiment Analysis,"IEEE Trans. Knowledge and DataEngineering, vol. 28, pp. 496-509, 2016.
[4] T. Zagibalov, and J. Carroll, "Automatic Seed Word Selectionfor Unsupervised Sentiment Classification of Chinese Text,"Proc.Int"l Conf. COLING, 2008.
[7] A. Y. Ng, M. I. Jordan, andY. Weiss, "On Spectral Clustering:Analysis and an Algorithm,"Advances in NIPS, 2001.
[8] B. Pang, and L. Lee, "A Sentimental Education: SentimentAnalysis Using SubjectivitySummarization Based on MinimumCuts,"Proc. Annu. Meet. ACL, 2004.
[9] Y. Dang, Y. Zhang, and H.Chen, "A Lexicon-EnhancedMethod for Sentiment Classification: An Experiment on OnlineProduct Reviews,"IEEE Intelligent Systems, vol. 25, pp. 46-53,2010.
[10] Y. Hu, and et. al., "A Language Modeling Approach toSentiment Analysis,"Proc. Int"l Conf. ICCS, 2007.
[11] M. Thelwall, and et. al.,"Sentiment in Short StrengthDetection Informal Text,"JASIST, vol. 61, pp. 2544-2558, 2010.
[12] T. Mikolov, and et. al., "Distributed Representations of Wordsand Phrases and their Compositionality,"Advances in NIPS, 2013.
[13] A. L. Maas, and et. al., "Learning Word Vectors for SentimentAnalysis,"Proc. Annu. Meet. ACL, 2011.
[14] I. Labutov, and H. Lipson, "Re-Embedding Words,"Proc.Annu. Meet. ACL, 2013.
[15] D. Tang, and et. al., "Sentiment Embeddings with Applicationsto Sentiment Analysis,"IEEE Trans. Knowledge and DataEngineering, vol. 28, pp. 496-509, 2016.
[16] D. Davidov, O. Tsur, andA. Rappoport, "Enhanced SentimentLearning Using Twitter Hashtags and Smileys,"Proc. Int"l Conf.COLING, 2010.
[17] C. Tan, and et. al., "User-Level Sentiment AnalysisIncorporating Social Networks,"Proc. ACM Int"l Conf. SIGKDD,2011.
[18] J. S. Olsson, D. W. Oard,and J. Hajic, "Cross-Language TextClassification,"Proc. Annu. Int"l ACM Conf. SIGIR, 2005
[19] J. Brooke, M. Tofiloski,and M. Taboada, "Cross-LinguisticSentiment Analysis: From English to Spanish,"Recent Advances inNIPS, 2009.
[20] C. Wan, R. Pan, and J. Li, "Bi-Weighting Domain Adaptationfor Cross-Language Text Classification,"Proc. Int"l Joint Conf.IJCAI, 2011.
[21] M. S. Hajmohammadi, R. Ibrahim, A. Selamat, and H. Fujita, "Combination of Active Learning and Self-Training for Cross-Lingual Sentiment Classification with Density Analysis ofUnlabelled Samples,"Information Sciences, vol. 317, pp. 67-77,2015.
[22] D. Gao, and et. al.,"Cross-Lingual Sentiment LexiconLearning with Bilingual Word Graph Label Propagation," Computational Linguistics, vol. 41, pp. 21-40, 2015.
[23] M. S. C. Almeida, and et. al., "Aligning Opinions: Cross-Lingual Opinion Miningwith Dependencies,"Proc. ACL/AFNLPJoint Conf., 2015.
[24] H. Guo, and et. al., "OpinionIt: A Text Mining System forCross-Lingual Opinion Analysis,"Proc. ACM CIKM, 2010.
[25] S. Jain, and S. Batra, "Cross Lingual Sentiment Analysis usingModified BRAE,"In Proc. Conf EMNLP, 2015.
[26] P. Prettenhofer, and B.Stein, "Cross-Language TextClassification Using Structural Correspondence Learning,"Proc.Annu. Meet. ACL, 2010.
[27] P. Prettenhofer, and B. Stein, "Cross-Lingual Adaptation UsingStructural Correspondence Learning,"ACM TIST, vol. 3, p. 13,2011.
[28] J. Blitzer, M. Dredze, and F.Pereira, "Biographies, Bollywood,Boom-Boxes and Blenders: Domain Adaptation for SentimentClassification,"Proc. Annu. Meet. ACL, 2007.