Feature Hashing

今天早上,我透過網路在第八届中国R语言会议(南昌)暨江西财经大学第一届金融大数据论坛上宣傳自己的套件FeatureHashing。 由於用中華電信連中國實在是不穩,所以我就預錄了影片請馮帥(原本都稱馮兄的,視頻過後真的要改口說馮帥了!這才是科學的態度阿,不人云亦云)。現場聽講的老師因為中途加入,還以為我是實際連線跟他們報告呢,哈哈。 事實上,我錄了兩個版本。第一個版本因為講解的太仔細了,結果超過時間的兩倍。我覺得刪除還是太可惜了,所以就上傳到Youtube上: 如果有朋友要在R 裡面處理大量的文字相關的資料,可以看看這個套件。如果想要知道相關技術的細節,以及想知道為什麼大數據的環境之下,Feature hashing »

KDD 2015 Keynote:「Online Controlled Experiments: Lessons from Running A/B/n Tests for 12 years」聽後感

今年在KDD 2015我聽到的第一場來自微軟的Ron Kohavi的演講就非常精彩。以下節錄一些值得我自己未來做線上AB分流實驗時,一直要謹記在心的要點: 取得改善就是一種很大的挑戰。許多看起來很成功的想法,往往最後不但不能改善,還會把事情搞砸。 實驗跑越多,就會越謙虛 在做大規模的事情之前,一定要先簡單測試自己的想法 To have a great idea, have a lot of them - Thomas Edison »