轉帖|使用教程|編輯:龔雪|2015-12-08 16:21:53.000|閱讀 718 次
概述:本文是關于VintaSoft Imaging .NET與OCR模塊結合對數字識別功能的介紹,重點介紹了如何將OCR設置為只識別數字。附有代碼可供參考。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
VintaSoftImaging.NET SDK是一個為.NET開發人員開發的,強大而易于使用的圖像工具包。它可以讓你加載、查看、處理、打印和保存數字圖像,可將它們轉換為不同的圖像格式,可用多種TIFF和動態GIF文件提高您的工作效率。
并且該產品還可以添加多個模塊:圖片注釋模塊、PDF模塊、JBIG2模塊、JPEG2000模塊、文檔清潔模塊、DICOM模塊、OCR模塊和表單處理模塊,結合這些模塊開發人員可以開發出現代化的商業應用程序 這篇文章主要介紹VintaSoft Imaging .NET怎么和OCR模塊結合,OCR識別模塊識別率高,支持多國語言包含中文,并且可以自定義多種功能,下面的代碼主要講述了怎么設置OCR只對圖片中的數字進行識別,具體如下:
using System;
using Vintasoft.Imaging;
using Vintasoft.Imaging.Ocr;
using Vintasoft.Imaging.Ocr.Results;
using Vintasoft.Imaging.Ocr.Tesseract;
class TesseractOcrSetVariableExample
{
// Required assemblies to run this code:
// Vintasoft.Imaging.dll, Vintasoft.Imaging.Ocr.dll, Vintasoft.Imaging.Ocr.Tesseract.dll
public static void OcrImageWithDigits(string filename)
{
// load image(s)
ImageCollection images = new ImageCollection();
images.Add(filename);
Console.WriteLine("Create Tesseract OCR engine...");
using (TesseractOcr tesseractOcr = new TesseractOcr())
{
Console.WriteLine("Initialize OCR engine...");
tesseractOcr.Init(new OcrEngineSettings(OcrLanguage.English));
// set white list
tesseractOcr.SetVariable(
"tessedit_char_whitelist", "01234567890");
// foreach image
foreach (VintasoftImage image in images)
{
Console.WriteLine("Recognize the image...");
OcrPage page = tesseractOcr.Recognize(image);
Console.WriteLine("Page Text:");
Console.WriteLine(page.GetText());
Console.WriteLine();
}
// shutdown OCR engine
tesseractOcr.Shutdown();
}
// free resources
images.ClearAndDisposeItems();
images.Dispose();
}
}
本文轉自
查看產品詳情
購買最新正版授權!""
慧都年終盛典火爆開啟,一年僅一次的最強促銷,破冰鉅惠不容錯過!!優惠詳情點擊查看>>
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@ke049m.cn