Combine three communities, Taiwan R-User Group, R-Ladies Taipei and Azure Taiwan Community. Let's have fun in this day with real data experience, hacking and connecting with each other.
Data Science Playground
Data Science Playground
Talks
基于 Elastic Stack 的大数据分析
曾勇
IB202
08/12 09:30 - 10:20
漢語 / Mandarin Chinese
Beginner / 入門
Data Scientist, DevOps, Developer, Manager etc.
Elastic Stack(github.com/elastic)是时下非常新颖的一个开源的大数据分析和可视化交互平台,包括 Elasticsearch、Logstash、Kibana 和 Beats 这 4 个主要的开源组件,可以为用户提供各种便利的分析能力和可视化展现效果,本次分享将介绍 Elastic Stack 的使用以及结合 Demo 来具体介绍如何使用 Elastic Stack 进行数据分析的方法。
演讲主题包括以下几个方面:
Elastic Stack 项目历史;
Elastic Stack 基本概念;
Demo 演示;
Kibana Canvas;
Kibana Geo 地理位置分析。
維基教我做的金頭腦:知識圖譜製作初體驗
張泰瑋
IB202
08/12 10:30 - 11:20
漢語 / Mandarin Chinese
Skilled / 中階
『有 Python 基礎和對 text mining 有興趣的人』,不需要有 machine learning 或 deep learning 的經驗沒關係。
摘要
【百萬小學堂】、【金頭腦】這類的益智節目,在台灣也風靡一時。
而電腦是否能在節目上超越人腦,也一直是人們茶餘飯後討論的話題。
在 2011 年的益智問答節目 Jeopardy 中,IBM 的華生電腦(Watson)擊敗兩位世界紀錄保持人並贏得 100 萬美元,造成不小轟動。本次 talk,將介紹如何自製一個答題機器人。
目前,電腦對於自然語言的理解依然有限,舉例來說: 要讓電腦知道『蘋果』是什麼? 就是個困難的問題。
因為蘋果在一句話中可能是指水果、手機或是喜歡的人 (流行音樂中的小蘋果)。為了克服這個難題,文字探勘(text mining) 中有個子領域叫做知識圖譜(Ontoloty),目的就是希望將人類所有的知識以及規則儲存成結構化的資料。
如此,在解析文字時,就會知道蘋果是水果 or 電腦、知道周杰倫是歌手。對益智節目、聊天機器人等應用都會產生莫大的助益。
本 talk 將會介紹知識圖譜的應用、目前的做法與瓶頸、如何使用 Wikipedia 自動建立支援各國語言的知識圖譜,最後 Demo 一下答題機器人的智商到底行不行。
玩轉 LHC 公開數據
趙元
IB202
08/12 11:30 - 12:20
漢語 / Mandarin Chinese
Skilled / 中階
大數據的愛好者,或是對科學有興趣以及有 python 基本知識的朋友
LHC 實驗位於瑞法邊境的歐洲粒子研究中心 (CERN),以高能量的質子對撞實驗來研究基本粒子的交互作用等現象。去年 (2017) 年底一份新的實驗數據,以 CC0 公開在其網頁上,總量已達到了 PB 的等級。這份正是 2012 年發現希格斯粒子所使用的實驗數據與模擬事例。將簡單說明如何取得這些數據,還有資料格式。同時藉由 Jupyter 筆記本,展示如何分析使用這些公開數據,希望聽眾也可以有所啟發,使用在自己的領域上。
人工智慧與財務分析
王淳恆
IB202
08/12 12:30 - 13:20
漢語 / Mandarin Chinese
Beginner / 入門
對人工智慧與股市分析有興趣的人
如何利用公開資料打造價值千萬的 AI 證券分析師
通過鏈上資料分析判斷錢包地址歸屬
李立鴻
IB202
08/12 13:30 - 14:20
漢語 / Mandarin Chinese
Skilled / 中階
從事數據挖掘、數據分析和數據建模的興趣愛好者和工程師
這是一個以當下火熱的區塊鏈為切入點探討數據挖掘和分析價值的議題。區塊鏈上的交易和地址包含了眾多公開資料,通過這些資料能夠獲得哪些資訊是一個非常有意思的話題。我們以比特幣為例,一步一步體驗如何分析鏈上資料,可以對鏈上參與交易的人進行歸類分析。其中包含:1. Petri 模型解釋:地址的 Petri Net + 實體的 Petri Net;2. 地址及實體相關聯的演算法分析;3. python 代碼實現。
uTensor: AI on Microcontroller
Neil Tan, Kazami Hsieh, DBoy Liao
IB202
08/12 14:30 - 15:20
漢語 / Mandarin Chinese
Skilled / 中階
Data Scientists, ML Engineers, Embedded Engineers
uTensor is a framework that enables developers to deploy machine learning models on Microcontrollers (MCUs). AI inference today are typically done on high-performance computing units, such as, GPUs and TPUs. MCUs are low-energy and low-cost units. Deploying machine learning models on MCUs is a challenge because of their limited RAM size, flash capacity and clock-speed. uTensor addresses this by converting models directly into importable C++ source code, supporting quantization operators and using resource management schemes. In this talk, we will introduce Tensor, its run-time, code-generator and future work.