在某 irc 頻道有個 bot 會定時 parse 各大新聞標題,這幾年來觀察的小心得…
大部份情況都可以符合多數人想觀注的新聞:
* CLnewS [趴] [爆乳] 爆乳裝跑趴 孟廣美披肩遮點
* CLnewS [性愛] [人妻] [淫] [偷拍] 偷拍人妻賣淫 製性愛光碟勒索 (NOWnews)
* CLnewS [巨乳] [自拍] 自拍 巨乳 性感 (rss@diggirl.net)
但斷詞不正確就會出現如下的情形:
* CLnewS [性感] 嘉市流行性感冒疫苗即起免費施打 (教育廣播)
* CLnewS [變態] 美改變態度 向韓售「全球之鷹」偵察機 (中廣)
* CLnewS [賣春] 抗議!以色列餐廳今天不賣春捲 (中廣)
斷詞對了,語境(Context)不正確也會出現:
* CLnewS [裸露] 興昌橋橋墩裸露 (中央社)
斷詞對了,語境(Context)對了,可是內容也會出現不想看的:
* CLnewS [露點] 「台灣戰神」朱木炎露點拼三鐵 緊張哦 (中廣)
* CLnewS [性騷擾] 農場驚爆性騷擾 緝捕野山豬
所以關鍵字真是門藝術呀。