Hough Line Transform
จาก Morange Wiki
เนื้อหา
Hough Line Transform
วัตถุประสงค์
- การเรียนรู้ในบทนี้
- จะเข้าใจเกี่ยวกับแนวคิดของ Hough Tranform
- ให้การวิธีการใช้งาน การตรวจสอบเส้น (lines)
- รู้จักวิธีการใช้งานฟังก์ชั่น cv2.HoughLines(), cv2.HoughLinesP()
ทฤษฎี
- Hough Transform คือเทคนิคที่ใช้งานกันเยอะที่สุดสำหรับการตรวจจับ ถ้าสามารถแสดงรูปร่างในทางคณิตศาสตร์ ก็จะสามารถตรวจจับรูปร่างได้รวมถึง การเจอรูปแตกหักเสียหายและเพี้ยนๆนิดหน่อย เริ่ม
- โดย เส้นนั้นจะสามารถแสดงเป็นสูตรได้ คือ y = mx + C หรือ ในรูปแบบของ พาราเมตริก จะได้ว่า ρ = xcos θ + ysin θ เมื่อ ρ คือระยะตั้งฉากจากต้นทางไปยังเส้น และ θ คือมุมที่เกิดจากเส้นตั้งฉาก และ horizontal axis หมุนทวนเข็มนาฬิกา
Thanks OpenCV.org
- ดังนั้นเส้นจะผ่านไปทางเดิม จะทำให้มี rho เป็น Positive และ มุมจะมีค่าน้อยกว่า 180 องศา ดังนั้นจำเกิดการแทนมุมที่มากกว่า 180 องศา และจะให้มุม 180 องศาเป็นเชิงลบ เส้นแนวตั้งใดๆนั้น จะ มี 0 องศาและเส้นแนวนอนจะมี 90 องศา
- ขณะนี้เรามาดูวิธีที่ Hough Transform จะทำงานได้ดีสำหรับ Hough Transform Line ในสามารถแสดงได้ผลได้โดยสองหลักนี้คือ (ρ,θ). และตอนแนกเราจะสร้าง อาร์เรย์สองมิติ หรือ การสะสม (เพื่อเก็บค่าของพารามิเตอร์ที่สอง) และจะมีการตั้งค่าเป็น 0 ในขั้นต้น โดยจะแสดงแถว ρ และคอลัมน์แสดง θ ขนาดของอาร์เรย์ขึ้นอยู่กับความถูกต้องของมุมที่จะเป็น 1 องศา ดังนั้นจะต้อง 180 คอลัมน์ สำหรับ ρ ระยะทางสูงสุดที่จะเป็นไปได้คือ ความยาวของเส้นทแยงมุมของรูปภาพ ดังนั้นการใช้สูตร พิกเซลหนึ่งของจำนวนแถวจะต้องถูกต้องและสามารถมรตวามยาวเท่ากับเส้นทแยงมุมของภาพ
Hough Transform in OpenCV
- ทุกๆอย่างที่อธิบายไว้ข้างต้นนั้นจะอยู่กับโค๊ดตัวอย่างด้านล่าง โดยใช้ ฟังก์ชั่น cv2.HoughLines() เพื่อรับค่า อาร์เรย์ของคณิตศาสตร์ (rho,theta) และค่า ρ คือ การวัดค่า พิกเซลและค่า θ คือค่าวัดที่เป็น Radians (เรเดียน) และ พารามิเตอร์แรกนั้นจะนำเข้ารูปภาพและแสดงเป็น ไบนารี ออกไป และจะเรียกใช้งาน threshold (เกณฑ์การวัดคุณภาพ) หรือ Canny Edge Detection ก่อนจะหา Hough Transfrm และ พารามีเตอร์ที่ 2 และ 3 จะเป็นค่า ρ และ θ โดยจะมีความถูกต้องตามลำดับ และ พารามีเตอร์ที่ 4 นั้น จะเป็น threshold ซึ่งจะหมายถึงการลงคะแนน (Vote) ขั้นต่ำที่ควรจะได้รับมันจะถูกพิจารณารเป็นบรรทัดๆไป
Code Example In OpenCV
import cv2 import numpy as np img = cv2.imread('tables.jpg') gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) edges = cv2.Canny(gray,50,150,apertureSize = 3) lines = cv2.HoughLines(edges,1,np.pi/180,200) for line in lines: rho,theta = line[0] a = np.cos(theta) b = np.sin(theta) x0 = a*rho y0 = b*rho x1 = int(x0 + 1000*(-b)) y1 = int(y0 + 1000*(a)) x2 = int(x0 - 1000*(-b)) y2 = int(y0 - 1000*(a)) cv2.line(img,(x1,y1),(x2,y2),(0,0,255),2) cv2.imwrite('houghlines3.jpg',img)
Result
มีข้อผิดพลาดในการสร้างรูปย่อ: ไฟล์สูญหาย
Probabilistic Hough Transform
ใน Hough Transform นั้น จะสามารถเห็นเส้นในขณะนั้นด้วย 2 arguments จะทำให้การคำนวณนั้นใช้เวลานานมากขึ้น โดยความน่าจะเป็นของ Hough Transform เป็นการเพิ่มประสิทธิภาพของ Hough Transform โดยเราจะเห็นได้ไม่ทุกจุด โดยการพิจารณาทนที่จะใช้เวลาเพียงกลุ่มย่อยๆนั้น จะทำให้เพียงพอสำหรับการตรวจหา เส้น เพียงแค่เราลดเกณฑ์ สามารถดูภาพด้านล่างซึ่งเปรียบเทียบ Hough Transform และความน่าจะเป็นจะเป็นเพื้นที่ของ gough
Code Example
import cv2 import numpy as np img = cv2.imread('tables.jpg') gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) edges = cv2.Canny(gray,50,150,apertureSize = 3) lines = cv2.HoughLinesP(edges,1,np.pi/180,100,minLineLength=100,maxLineGap=10) for line in lines: x1,y1,x2,y2 = line[0] cv2.line(img,(x1,y1),(x2,y2),(0,255,0),2) cv2.imwrite('houghlines5.jpg',img)
Result
มีข้อผิดพลาดในการสร้างรูปย่อ: ไฟล์สูญหาย