再说自动图文识别技术----OCR技术

| | Comments (0) | TrackBacks (0)
前几天去香山植物园的光敏实验室,看到了一个美眉在操作电脑,只见她面前放着一本厚厚的字典,正在认认真真的看着字典往电脑中录入,起初我以为她是在练习打字,后来问过才知道原来是在进行植物名录的电子化归档。

看着那本厚厚的字典,我有些被吓呆了,记得当时旁边有个人说了句"这样的字典有好几十本",我想那个美眉真令人钦佩,她在我心目中的地位直接晋升为"神"。

自从信息技术发展以来,传统的信息载体纸张就越来越显现出弊端,而信息化存储的优越性也越来越多的被体现出来,而已经有千年文明的人类,自然要逐渐将文明成果录入到电脑中,这是毋庸置疑的事情。

但我没有想到的是,这个录入过程竟然如此"人肉"。

从植物园回来,那个"人肉录入机"的影像久久无法从我的脑海中消失,于是我急忙找到了乐呵呵,要回借给她的相机,又从报刊亭买了份英文报纸,回来后用相机的"文档资料"模式拍摄了几张照片,并用Google发布的一款开源OCR进行转换,看了下效果,转换率基本达到了99%以上,只有一些标点符号被错误的进行了转换,绝大多数英文都是可以被识别出来的。

明天,哦不,应该是今天,今天的下午我睡醒之后,要再去一趟植物园,并告诉他们OCR是什么。

另注:自己总是好为人师,结果闹得大多数情况下都给人造成很多麻烦。有些公司和企业,他们明明知道有更高效的技术和方法,但往往抛弃先进的方法,乐于使用低效的手段。究其原因,就是制造更多的就业机会、给更多雇员以忙碌感,而我的好为人师,闹不好得不到任何感谢,反而会让人觉得我是在砸他们的饭碗。

0 TrackBacks

Listed below are links to blogs that reference this entry: 再说自动图文识别技术----OCR技术.

TrackBack URL for this entry: http://shangning.net/chinese/mt-tb.cgi/116

Leave a comment

友情链接

Google