สอบถามว่า ต้องเขียน Code อย่างไร จึงจะทำให้ระบบ Tesseract js อ่านภาษาไทยแบบ OCR ได้ดีเทียบเท่า Google Cloud Vision API เนื่องจากได้ลองเขียน Code เรื่องระบบ Tesseract js กับการอ่านภาษาไทยแบบ OCR ตาม Link


Code ทั้งหมด มีดังนี้

1. index.html

<!DOCTYPE html>                    
<title>OCR แปลงรูปภาพข้อความเป็นข้อความที่แก้ไขได้</title>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> 
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1">
<script src="https://ajax.googleapis.com/ajax/libs/jquery/1.9.1/jquery.min.js"></script>
<link rel="stylesheet" href="css/bootstrap.min.css" >
<link rel="stylesheet" href="css/bootstrap-theme.min.css" >
<script src="js/bootstrap.min.js"></script>
<script src="js/tesseract.js"></script>


	function readURL(input) {

        if (input[0].value != "") {
            var reader = new FileReader();
            reader.onload = function (e) {

      function createorc(result){
       var img = '<img id="dataface" src="'+result+'" style="max-width:100%;">';
        Tesseract.recognize(result,{lang: $(".langdetect").val()})
       .progress(function  (p) { $("#loading").show(); })
       .then(data => {
            $(".showtxt").html(data.text.replace(/n/g, "<br />"));
       .catch(err => {
        //console.log('catchn', err);
       .finally(e => {

  $( "#imagebroswer" ).change(function() { 
    #loading {
    top: 0;
    left: 0;
    background-color: rgba(255,255,255,.8);
    min-width: 100%;
    min-height: 100%;
    height: auto;
    position: fixed;
    z-index: 100000000;
    position: absolute;
    text-align: center;
<div id="loading">
  <div class="abx">
     <div align="center">กำลังประมวลผล</div>
       <div class="container" style="padding:25px;">
   <div class="row">

   <h3>OCR แปลงรูปภาพข้อความเป็นข้อความที่แก้ไขได้</h3>
     <div class="form-group">

   <div  class="col-md-3">
   <label for="">เลือกภาษา</label>
  <select class="form-control langdetect" >
  <option value='eng'     selected> English  </option>
  <option value='tha'> Thai </option>

    <div  class="col-md-3">
  <label for="">เลือกรูป</label>
  <input class="form-control" id="imagebroswer" type="file">

   <div  style="">
    <div class="row" >
    <div id="preview" class="col-md-6">      
    <img id="dataface" src="txtsample.png"  style="max-width:100%;"> 
      <div class="col-md-6">
      <div class="showtxt " style="padding:25px 25px;border:1px solid #000;min-height:200px;">


2. tesseract.js (อยู่ใน Floder js ครับ)

3. Link สำหรับ Download Source Code ทั้งหมดครับhttps://webunique.in.th/blog/simple/ocr.zip ซึ่งมีโครงสร้างของไฟล์ทั้งหมด ดังนี้ครับ

แล้วติดปัญหาในการ OCR คือ ได้ลองตัวอย่างรูปฉลากสินค้า ตาม Link ตัวอย่างรูป


และทำการ Crop เอาเฉพาะส่วนผสมของอาหาร ตามรูปด้านล่างครับ

แล้วทำการทดสอบ Code ในส่วนระบบ Tesseract js แล้วเจอปัญหาในเรื่อง OCR ออกมาได้ข้อมูลไม่ถูกต้อง และ OCR ได้เฉพาะแบบเลือกทีละ 1 ภาษาเท่านั้น ตามรูปด้านล่างครับ

จึงสอบถามว่า ต้องแก้ไข Code อย่างไร จึงจะ OCR ด้วยระบบ Tesseract js แล้ว อ่านค่าได้ถูกต้อง และอ่านค่าได้พร้อมกันทั้ง 2 ภาษา ตามรูปที่ต้องการอ่านค่าได้ถูกต้อง ด้านล่างครับ


 ความคิดเห็นที่ 1
ไม่เคยลองเลย แต่ถ้าแนะนำ คงต้องอ่านข้อจำกัด ความสามารถ ของตัว library ที่เราใช้งาน ว่าทำได้แค่ไหน ถ้ายังไม่ใช่ที่เราต้องการ อาจจะลองหาตัวอื่นดู เช่นถ้า Google ทำได้ดีกว่า ลองหาว่า เขามี API ให้มั้ย ถ้ามีก็ลองศึกษา และปรับมาใช้ดู

ninenik 27.55.68.xxx 10-06-2020
 ความคิดเห็นที่ 2
ลองของ Google Vision API ตามนี้ดู
ลองเล่นเป็น PHP หรือภาษาที่เราถนัด แล้วถ้าจะใช้กับ javascript ค่อยใช้ ajax ไปเรียกใช้ก็ได้
แต่ตัวนี้จะใช้ฟรีได้แค่ 1000 request  หรือนับเป็น 1000 รุปที่เราทำการ detect ต่อเดือน จะฟรี
หลังจากนั้น เขาจะมีเรทราคา และวิธีคิดตามลิ้งค์นี้ https://cloud.google.com/vision/pricing
ซึ่งถ้าเราจะใช้ของ google จำเป็นจะต้องใช้บัตรเครดิต หรือ เดบิต ที่ซื้อของออนไลน์ได้ ผูกในบัญชีไว้
ที่นี้ก็ขึ้นกับว่าเราจะใช้งาน ฟังก์ชั่นหรือความสามารถนี้กับอะไร ชั่งใจ และเลือกใช้งานตามความเหมาะสม

// โค้ดไฟล์ dbconnect.php ดูได้ที่ http://niik.in/que_2398_5642
 require_once("../dbconnect.php"); // กำหนด path ให้ถูกต้อง

// include composer autoload
require_once '../vendor/autoload.php'; // กำหนด path ให้ถูกต้อง

use Google\Cloud\Vision\V1\Feature;
use Google\Cloud\Vision\V1\Feature\Type;
use Google\Cloud\Vision\V1\ImageAnnotatorClient;

<!DOCTYPE html>
<html lang='en'>
    <meta charset='utf-8' />
	<meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
	<meta http-equiv="Content-Security-Policy" content="block-all-mixed-content">
    <link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/4.5.0/css/bootstrap.min.css">

<div class="w-50 mx-auto mt-5">
//putenv('GOOGLE_APPLICATION_CREDENTIALS=ไฟล์ service account ได้ที่.json');
$imageAnnotatorClient = new ImageAnnotatorClient();
try {
/*    $requests = [];
    $response = $imageAnnotatorClient->batchAnnotateImages($requests);*/
	$imageResource = fopen('2sZYrMe.png', 'r');
	$features = [Type::TEXT_DETECTION];
	$response = $imageAnnotatorClient->annotateImage($imageResource, $features);	
	echo "<pre>";
	$texts = $response->getTextAnnotations();

	printf('%d texts found:' . PHP_EOL, count($texts));
	foreach ($texts as $text) {
		print($text->getDescription() . PHP_EOL);

		# get bounds
		$vertices = $text->getBoundingPoly()->getVertices();
		$bounds = [];
		foreach ($vertices as $vertex) {
			$bounds[] = sprintf('(%d,%d)', $vertex->getX(), $vertex->getY());
		print('Bounds: ' . join(', ', $bounds) . PHP_EOL);
} finally {


จริงๆ แล้วการแปลง รูปภาพเป็น ข้อความ ที่ทำได้ดี และรองรับภาษาไทย ค่อนข้างสมบูรณ์ จะมีของ line 
และก็ google ซึ่ง line เราสามารถใช้ใน แอป line ได้เลย ง่ายและสะดวก ในช่องที่พิมพ์สนทนา เลือกการ
ใช้งานกล้อง แล้วเลือกโหมด text scan เราก็สามารถถ่ายรูป และแปลงข้อความในรูปเป็นข้อความ ที่สามารถ
เอามาแก้ไขได้ รองรับภาษาไทย อังกฤษในรุปเดียวกัน
    ใน google ก็จะมีแอป google translate เวลาใช้งานก็เลือก การตรวจจับภาษา เป็น ไทย หรือ 
detect language และเลือกแปลเป็นภาษาไทย กดเข้าไปในโหมดถ่ายรุป camera แล้วฟังก์ชั่น scan ถ่ายรูป
ที่ต้องการ ตัวแอปจะทำการจับข้อความในรูป เลือกปุ่ม หรือเมนู select all จะเป็นการให้แอปเอาข้อความทั้งหมด
ที่ตรวจจับได้ ข้อความก็จะมาแสดงให้เราสามารถก้อปไปใช้งานได้
    ส่วนการจะใช้เป็น api ตอนนี้ google น่าจะทำได้ดีกว่า แต่การนำไปใช้ ถ้าพอเดาได้ ก็คงเป็นการนำไปใช้ในการ
ค้นหาข้อความใน pdf หรือ รูปมากกว่า หรือไม่ก็ต้องการแปลงรูปภาพเป็นข้อความ อะไรประมาณนั้น

ninenik 27.55.88.xxx 11-06-2020

เว็บไซต์ของเราให้บริการเนื้อหาบทความสำหรับนักพัฒนา โดยพึ่งพารายได้เล็กน้อยจากการแสดงโฆษณา โปรดสนับสนุนเว็บไซต์ของเราด้วยการปิดการใช้งานตัวปิดกั้นโฆษณา (Disable Ads Blocker) ขอบคุณครับ