微软宣布 Azure Translator 内置的文档翻译功能现可扫描和翻译 PDF 文档。该公司表示,用户在尝试翻译文档之前不再需要通过 OCR 引擎对文档进行预处理。 Azure Translator 在一年前推出了文档翻译功能,能够一次将多个文档翻译成 110 多种语言和方言。今天的更新意味着完全支持 Word 和 PowerPoint 文件之外,现在也支持 PDF 文件。
微软在解释一些功能时说文档翻译功能现在变得更加智能了,可以
● 识别 PDF 文档是否包含扫描的图像内容,
● 将包含扫描图像内容的 PDF 路由到内部的 OCR 引擎以提取文本,
● 将翻译后的内容重建为常规文本 PDF,同时保留原始布局和结构。
虽然文档翻译适用于 110 种语言和方言,但新的扫描功能仅适用于 68 种源语言和 87 种目标语言。微软已承诺在“适当的时候”增加对更多的支持。
微软表示,无需更改代码即可开始使用新功能,并且所有 PDF 都可以立即提交给 Translator。新功能不会让客户多花钱。通过 Azure 提供两种用于文档翻译的定价计划;它们包括现收现付计划和针对更高数量的 D3 数量折扣计划。aka.ms/TranslatorPricing