搜狗雲輸入法,來自http://pinyin.sogou.com/cloud

update:今天官方又出了個Firefox的“插件”。拜託,這東西應該被叫做擴展。還是個概念產品,然後就已經被linux fans嵌入到ibus里了(比如這裡以及這裡),這裡有個示例性的腳本

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
#!/bin/bash
content=
#sed的url解碼函數
	urldecode(){
		echo $1| echo -e "$(sed 'y/+/ /; s/%/\\x/g')"
}
geturl(){
	xx=`w3m -dump -no-cookie http://web.pinyin.sogou.com/web_ime/get_ajax/${1}.key|sed -n '2p'|sed 's/^"\(.*\)"\;/\1/g'`
xx2=`urldecode $xx|sed 's/\:[0-9]//g'`
	echo $xx2
}
exitpy(){
	clear
		echo $content|xsel -b 2>/dev/null
		echo $content|xsel 2>/dev/null
		echo -e "\n你輸入的文本是:\n   $content\n\n   如果系統中有xsel那麼已複製入剪貼板,歡迎使用,再見!!"
		exit
}
 
while :
do
 
clear
	echo -e "      利用搜狗雲輸入法API的終端輸入法\n"
	echo -e "提示: 可直接輸入數字,第一個字母為v時直接輸入英文.\n      輸入del刪除最後一個字符,輸入exit退出。選詞時輸入0返回。"
	echo -e "\n現在的內容是:\n\n  $content\n\n"
	read pinyin
	[ `echo "$pinyin" | grep "^[0-9]*$"` ] &&  content+="${pinyin}" && continue  
	[ ${pinyin::1} == "v" ] && content+="${pinyin:1}" && continue  
	[ $pinyin == "exit" ] && exitpy 
	[ $pinyin == "del" ] && content="${content::${#content}-1}" && continue 
	echo ""
	py=($(geturl $pinyin))
	echo  ${#py[@]}
[ ${#py[@]} -eq 0 ] && echo "沒有可選詞,請重新輸入" && sleep 1 && continue
	for ((i=0;i<${#py[@]};i++)){
		echo -n "$((i+1))、${py[$i]} "
	}
 
	while :
	do
	echo -e "\n"
		echo -e "\n 請輸入數字選擇"
		read i
		[ $i == "exit" ] && exitpy 
		[ $i == "del" ] && content="${content::${#content}-1}" && break
		[ `echo "$i" | grep "^[0-9]*$"` ] ||  continue
		[ $i -eq 0 ] && break
		[ ! -z "${py[i-1]}" ] 2>/dev/null&& content+="${py[i-1]}" && break 
		done
		done

稍稍試用了一下,準確率很高。據說使用了三元模型和trigger模型,語言模型大小4G(一般本地客戶端為10M左右),詞庫規模200W。還是很強大的。請注意,我們偉大的長城。因為是明碼傳輸,當你不小心輸入一些過濾詞的時候,網絡會被自動斷開或者延時大大加長。

其實,我感覺雲計算在天朝難有前途。