維基教我做的金頭腦:知識圖譜製作初體驗

Data Science Playground

IB202

08/12 10:30 - 11:20

漢語 / Mandarin Chinese

Skilled / 中階

『有 Python 基礎和對 text mining 有興趣的人』,不需要有 machine learning 或 deep learning 的經驗沒關係。

摘要
【百萬小學堂】、【金頭腦】這類的益智節目,在台灣也風靡一時。
而電腦是否能在節目上超越人腦,也一直是人們茶餘飯後討論的話題。
在 2011 年的益智問答節目 Jeopardy 中,IBM 的華生電腦(Watson)擊敗兩位世界紀錄保持人並贏得 100 萬美元,造成不小轟動。本次 talk,將介紹如何自製一個答題機器人。

目前,電腦對於自然語言的理解依然有限,舉例來說: 要讓電腦知道『蘋果』是什麼? 就是個困難的問題。
因為蘋果在一句話中可能是指水果、手機或是喜歡的人 (流行音樂中的小蘋果)。為了克服這個難題,文字探勘(text mining) 中有個子領域叫做知識圖譜(Ontoloty),目的就是希望將人類所有的知識以及規則儲存成結構化的資料。
如此,在解析文字時,就會知道蘋果是水果 or 電腦、知道周杰倫是歌手。對益智節目、聊天機器人等應用都會產生莫大的助益。

本 talk 將會介紹知識圖譜的應用、目前的做法與瓶頸、如何使用 Wikipedia 自動建立支援各國語言的知識圖譜,最後 Demo 一下答題機器人的智商到底行不行。


Collaborative notes on HackMD

張泰瑋

今年剛從中興資工系畢業,是 Dcard data engineer 新鮮人,馬上就要去被登入的準海軍陸戰隊請多指教 XD

Titanium Sponsor

Co-Host Sponsor

Diamond Sponsor

Gold Sponsor

Silver Sponsor

Bronze Sponsor

Partner

Co-Organizer

Special Thanks