“中国特色” 汉王OCR技术的市场之路
当我们轻松享受着纸质文档一键“复印”进电脑的便捷时,有没有想到是谁开辟了智能录入的先河,又有谁会想到在汉王大厦里有一批执着寻求让电脑录入更高效的人?刘迎建就是这群人的领袖,他们正在从事将对这个社会的发展具有推动力的工作,那就是OCR技术的研究与市场化。
OCR是英文Optical Character Recognition的缩写,即利用光学技术对文字或字符进行扫描识别并转换成计算机内码。OCR技术的出现则是文字电子化历程中的里程碑,与传统的手工录入方式相比,OCR技术大大提高人们资料录入存储、检索、加工的效率。
上世纪七十年代末,中国科学院自动化研究所率先进行了“文字字符识别”技术的研究与开发。那时,相继经历了对数字、英文字母及符号的研究,后来在我国政府对汉字自动识别输入研究的充分重视和支持下,经过科研人员十多年的辛勤努力,汉字识别技术的发展和应用已有了长足的进步,甚至已经位居世界前列。
但是一直以来,由于OCR(光学字符识别)系统技术的专业色彩浓厚,对于老百姓来说,要么觉得比较陌生,要么只能和市场上与扫描仪捆绑的OCR软件普及版联系起来。而如今,随着OCR技术的众多应用产品和解决方案源源不断的出现,不仅产品形态日益丰富、应用日趋扩展,OCR开始进入大众化应用时代。
“中国特色”的技术战略
早期有人认为,OCR技术在中国不会成气候,理由是中国厂商研发能力有限,缺乏有竞争力的新产品。就汉王科技而言,没有自主技术,产品就无法去参与真正的国际竞争,难免会沦为别人的制造基地。企业的软硬件设施,包括资金、厂房、生产线、设备、产品、人才乃至管理流程等等都是可以被模仿的,而自主技术却是一个企业在发展过程中形成的不可以仿造的独有资源。所以说到底,自主开发能力是一个企业核心竞争力的根本所在。
技术才是核心竞争力,汉王总裁刘迎建从来就相信这一点,因此汉王在发展之初就明确了自身的成长基础——秉承“专注成就精彩”,埋首核心技术研发。面对习惯使用技术垄断手段的国际巨头,刘迎建豪言:“我们要战胜垄断行为,一是靠法制,再就是自己在技术上的实力。”
汉王90年代初开始推出OCR产品。随着技术不断创新,汉王科技的OCR技术取得了突破性的进步,能识别报刊、杂志、书籍、文件、手稿等各类文字信息,成为市场上首家初步实用化的手写文稿扫描识别系统。
1998年,快速发展中的汉王做出了两项重大调整:一是加快了硬件生产基地的建设;二是加快了OCR识别、指纹识别等其他新技术的研步伐,为以后做好准备。并在与微软“交战”之后并购了当时中科院曙光公司的OCR研究部门,著名的模式识别专家刘昌平博士此时加入,组建了一支战斗力极强的研发团队,迅速加强了OCR的业务分量。此后汉王在OCR领域稳健发展并保持领军地位的事实证明,刘迎建当年的战略决策是非常英明的。
刘迎建深知,当计算机、手机、PDA和各种智能产品,都线网络连接起来的时候,IT技术的热点和市场竞争的焦点必将转移到人机智能交互技术,而占世界人口五分之一的使用汉语人群又无疑是其中的重中之重。只要重视用户的需求,开发出符合应用的产品,OCR技术一定会给汉王结出硕果。
不好唱的市场 “独角戏”
持续的科学研究,让我国的OCR技术和产品已经成熟,其识别率也已经达到相当高的水平,但是在应用方面,却远远落后于欧美以及日本等国家。事实上,不少中文OCR产品相继推出之后,OCR厂商一度沦为了扫描仪生产厂商的产业链条。虽然不少单位坚持了自主开发,创立了一些自主品牌,但是囿于应用设计未成型以及市场推广规模有限,经不起市场的考验和国际竞争的冲击,因而OCR市场未能显现出应有的活力。
此时,汉王在刘迎建的执著之下,一方面力求在OCR技术上达到了国内领先和成熟的应用要求,另一方面根据用户对OCR产品的各种需求,开发出各种成熟的应用产品。而除汉王外,清华大学、中科院沈阳自动化研究所、北京信息工程学院目前也在从事OCR的研究工作。催生了OCR技术与数字移动产品相结合的文字图像识别系统。
2001年,汉王的OCR技术达到了国际领先水平。它全面支持宋体、仿宋、楷体、黑体圆体、隶书、隶变、魏碑、行楷及各种变体;大字符集简繁混排识别支持国标GB2312-80的全部二级汉字,简繁混识,可识别6700多个简体汉字、台湾的繁体5401字以及3000余香港繁体字;中英文混排识别技术和表格识别技术更为先进。
而令国人更为振奋的是,面地全球范围内的竞争,汉王的在OCR市场的表现一直相当优秀。汉王的光学字符识别技术即使像微软这样的企业也难以超越。市场占有率前五名的扫描仪品牌产品,有四家捆绑有汉王科技的OCR软件;国内绝大部分银行票据识别系统在使用汉王的OCR技术;国家图书馆、首都图书馆、国防大学图书馆、北京大学图书馆等著名图书馆,都在使用汉王的OCR识别录入软件系统。
汉王的技术市场化时代
暂时的领先还不足够让刘迎建觉得满意,在他心中,只有不断的技术升级才可能在恶性竞争的环境中有议价权,只有不断的走技术市场化之路才能让OCR得到普及。
在刘迎建的指挥下,以汉王为代表的OCR技术开始了产品化的进程,汉王OCR新世纪版、OCR录入工厂、汉王票据识别系统、汉王名片通、汉王文本王。而OCR产品也从原来的单纯注重技术,扩大到对OCR系统的识别速度、用户界面的友好性、产品的稳定性、易用性及可靠性等方面。文本王是文表图高速录入系统,自从2002年第一款软件面世以来,已经发展为软件、硬件+软件、全能文本王等多种产品形态。
2005年,汉王推出的新一代汉王文本王——文豪7600,这款新产品凭借着一分钟逾万字的录入速度,高达99.6%的识别率突破了OCR领域有关世界记录,引起了用户的广泛关注。而产品的神奇之处,更在于实现了纸质文档快速地转换成可编辑修改的电子文档。此外拓展了文本王的识别范围, 通过屏幕识别功能,新增了对数码照片和PDF、Caj等格式电子图片的识别能力。将识别范围拓展到文本之外的图片,更是真正实现了将“死文件”在电脑中复活。
而行业应用市场的持续扩张也成为了OCR技术发展的一大动力,以OCR识别为核心的产品正在成为行业用户的采购热点。例如,汉王的文本王系列自推出以来,已经在政府、教育、金融、税务等行业进行了应用,而且涉及的行业越来越广泛。据介绍,文本王作为高速高效的智能录入解决方案已经广泛应用在政务信息化建设中。而高准确率、广泛的应用性、便捷的操作界面是吸引政府用户的重要特点,采用文本王进行大量文件、档案、历史资料的录入,极大地提高工作效率,节省人力成本,突破性地解决了信息化建设中的纸媒资料转化的难题。在教育行业,全国已有数万教育系统单位、学校采用文本王进行纸质教学资源的数字化、电子课件制作、电子化课堂教学以及教育教学信息在线发布与网络公告,在降低教师工作强度的同时,丰富了教育教学资源,提高教育信息化的应用速度。
值得一提的是,在OCR光学识别技术方面,汉王积极与诺基亚、LG、三星等手机厂商开展合作,推出了可以直接扫描、识别并存储名片的实用商务手机。从面令OCR技术应用更近距离地走近大众的身边.
未来的OCR更智能
“人们意识的改变,消费习惯的形成,在一定程度上来讲,是由商家决定的”。刘迎建认为2006年是数字影像技术应用普及的重要年头,伴随国内办公自动信息化的推广与普及,在商务办公、电子政务、数字化图书馆、医疗公安等领域方面,数码复印、智能录入产业存在着巨大的商机。
而几个月前,刘迎建又重新组织了集团内部结构,并且确定了汉王的发展战略。现在,汉王的定位是人机智能交互设备的提供商,汉王科技的企业使命就是让机器更智能、更友好。而OCR市场策略则是零售市场、行业市场、技术授权,三者互相补充,三驾马车同时出击开拓市场。同时从理念上教育市场,从实际应用上引导消费。
在刘迎建的心中,汉王的OCR将会越来越智能,因为汉王拥有市场领先的优势。用刘迎建的话来说,“这种领先地位是我们以技术为核心,多年来不断创新的成果,不但在行业领域取得了重大的成功,在个人领域也一直走在市场需求的前沿,例如和个人手持技术相结合的产品开发,嵌入式OCR技术和智能手机的结合就是一个很好的方向。为手机平台提供相应的解决方案,如提供名片的录入、存储和管理,文件资料的摘抄、翻译等等。目前我们和手机厂商的合作洽谈有了很好的进展。”
而对于OCR的前景,刘迎建没有任何犹豫。正如他过去所说的:“虽然电脑使人类处理信息的能力得到革命性的飞跃,但是对中文的处理却一直是个难题,这个难题需要中国人自己解决。”
汉王能否给出解决的答案,让我们拭目以待!