每一個可以努力的日子,都是一份厚禮。
搜狗雲輸入法的終端接口腳本
搜狗雲輸入法,來自http://pinyin.sogou.com/cloud
update:今天官方又出了個Firefox的“插件”。拜託,這東西應該被叫做擴展。還是個概念產品,然後就已經被linux fans嵌入到ibus里了(比如這裡以及這裡),這裡有個示例性的腳本:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 | #!/bin/bash content= #sed的url解碼函數 urldecode(){ echo $1| echo -e "$(sed 'y/+/ /; s/%/\\x/g')" } geturl(){ xx=`w3m -dump -no-cookie http://web.pinyin.sogou.com/web_ime/get_ajax/${1}.key|sed -n '2p'|sed 's/^"\(.*\)"\;/\1/g'` xx2=`urldecode $xx|sed 's/\:[0-9]//g'` echo $xx2 } exitpy(){ clear echo $content|xsel -b 2>/dev/null echo $content|xsel 2>/dev/null echo -e "\n你輸入的文本是:\n $content\n\n 如果系統中有xsel那麼已複製入剪貼板,歡迎使用,再見!!" exit } while : do clear echo -e " 利用搜狗雲輸入法API的終端輸入法\n" echo -e "提示: 可直接輸入數字,第一個字母為v時直接輸入英文.\n 輸入del刪除最後一個字符,輸入exit退出。選詞時輸入0返回。" echo -e "\n現在的內容是:\n\n $content\n\n" read pinyin [ `echo "$pinyin" | grep "^[0-9]*$"` ] && content+="${pinyin}" && continue [ ${pinyin::1} == "v" ] && content+="${pinyin:1}" && continue [ $pinyin == "exit" ] && exitpy [ $pinyin == "del" ] && content="${content::${#content}-1}" && continue echo "" py=($(geturl $pinyin)) echo ${#py[@]} [ ${#py[@]} -eq 0 ] && echo "沒有可選詞,請重新輸入" && sleep 1 && continue for ((i=0;i<${#py[@]};i++)){ echo -n "$((i+1))、${py[$i]} " } while : do echo -e "\n" echo -e "\n 請輸入數字選擇" read i [ $i == "exit" ] && exitpy [ $i == "del" ] && content="${content::${#content}-1}" && break [ `echo "$i" | grep "^[0-9]*$"` ] || continue [ $i -eq 0 ] && break [ ! -z "${py[i-1]}" ] 2>/dev/null&& content+="${py[i-1]}" && break done done |
稍稍試用了一下,準確率很高。據說使用了三元模型和trigger模型,語言模型大小4G(一般本地客戶端為10M左右),詞庫規模200W。還是很強大的。請注意,我們偉大的長城。因為是明碼傳輸,當你不小心輸入一些過濾詞的時候,網絡會被自動斷開或者延時大大加長。
其實,我感覺雲計算在天朝難有前途。
這篇文章由lovelucy於2009-11-30 16:33發表在編程。你可以訂閱RSS 2.0 也可以發表評論或引用到你的網站。除特殊說明外文章均為本人原創,並遵從署名-非商業性使用-相同方式共享創作協議,轉載或使用請註明作者和來源,尊重知識分享。 |
批評不自由
則讚美無意義