金融界2025年7月9日消息,国家知识产权局信息显示,深圳市腾讯计算机系统有限公司、云南大学申请一项名为“文本识别模型的训练方法、识别方法、装置及电子设备”的专利,公开号CN120279565A,申请日期为2024年01月。
专利摘要显示,本申请提供了一种文本识别模型的训练方法、识别方法、装置、电子设备及存储介质;方法包括:获取包括文本内容的待识别图像,并对待识别图像进行图像编码,得到待识别图像的图像特征;基于图像特征,对待识别图像进行位置解码,得到待识别图像中的至少一个目标像素点位置;对各目标像素点位置进行位置编码,得到目标位置特征,并结合目标位置特征和图像特征,对待识别图像进行文本解码,得到待识别图像中的文本内容;结合文本内容和目标像素点位置,确定待识别图像的文本识别结果。
来源:金融界