NLP natural language processing 簡介
2013/09/25 14:08
瀏覽1,225
迴響0
推薦13
引用0
NLP natural language processing, 中文是自然語言處理, 將人類使用的各型式語言轉換成電腦語言. (眼神, 手勢, 聲音, 語言, 語意, 肢體動作..等等).
找了幾個 lab 的研究方向,
台大 NTU NLPLab:人類語言技術(Human Language Technologies)、資訊檢索與擷取(Information Retrieval and Extraction)、和網路探勘(Web Mining)。
清大 NTHU.NLPLab 是 focus on 文字校對,資訊檢索系統及機器翻譯系統.
至於國外有 The Stanford NLP Group : sentence understanding, machine translation, probabilistic parsing and tagging, biomedical information extraction, grammar induction, word sense disambiguation, and automatic question answering.
CS (computer science) 最強的Carnegie Mellon, 擁有最豐富的研究學者跟資源, 併NLP/Computational Linguistics, 研究方向跟其他學校不同, 光看研究方向, 授課內容及教授陣容真的非常厲害的, 有興趣可以去看看. (Natural Language Processing / Computational Linguistics, Language Technologies Institute, School of Computer Science, Carnegie Mellon University, cs.cmu.edu/~nasmith/nlp-cl.html)
英文的部份, 我以前用過的 google trend還不賴.
英文的部份, 我以前用過的 google trend還不賴.
中文的部份, 可以到復旦的 FudanNLP 網站去試玩, 他們提供了工具包及網頁版本, 只要 copy 想要分析的文章(700字), 就可以進行簡單的分析.
FudanNLP主要是為中文自然語言處理而開發的工具包,也包含為實現這些任務的機器學習算法和數據集。 FudanNLP及其包含數據集使用LGPL3.0許可證。
FudanNLP開源中文自然語言處理工具包可依下列選取項目來進行分析.
FudanNLP開源中文自然語言處理工具包可依下列選取項目來進行分析.
中文分詞
詞性標註
依存句法分析
指代消解
時間抽取
語法分析樹
關鍵詞抽取
時間抽取
語法分析樹
關鍵詞抽取
我用了自己的 HTC 文章分析關鍵詞抽取, 還蠻有意思的.