Я пытаюсь извлечь объект из изображения, используя цвет, используя OpenCV, я пытался использовать обратное пороговое значение и оттенки серого в сочетании с cv2.findContours()
, но я не могу использовать его рекурсивно. Кроме того, я не могу понять, как «вырезать» совпадение из исходного изображения и сохранить его в один файл.
~
import cv2
import numpy as np
# load the images
empty = cv2.imread("empty.jpg")
full = cv2.imread("test.jpg")
# save color copy for visualization
full_c = full.copy()
# convert to grayscale
empty_g = cv2.cvtColor(empty, cv2.COLOR_BGR2GRAY)
full_g = cv2.cvtColor(full, cv2.COLOR_BGR2GRAY)
empty_g = cv2.GaussianBlur(empty_g, (51, 51), 0)
full_g = cv2.GaussianBlur(full_g, (51, 51), 0)
diff = full_g - empty_g
# thresholding
diff_th =
cv2.adaptiveThreshold(full_g,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
cv2.THRESH_BINARY,11,2)
# combine the difference image and the inverse threshold
zone = cv2.bitwise_and(diff, diff_th, None)
# threshold to get the mask instead of gray pixels
_, zone = cv2.threshold(bag, 100, 255, 0)
# dilate to account for the blurring in the beginning
kernel = np.ones((15, 15), np.uint8)
bag = cv2.dilate(bag, kernel, iterations=1)
# find contours, sort and draw the biggest one
contours, _ = cv2.findContours(bag, cv2.RETR_TREE,
cv2.CHAIN_APPROX_SIMPLE)
contours = sorted(contours, key=cv2.contourArea, reverse=True)[:3]
i = 0
while i < len(contours):
x, y, width, height = cv2.boundingRect(contours[i])
roi = full_c[y:y+height, x:x+width]
cv2.imwrite("piece"+str(i)+".png", roi)
i += 1
Где пусто — это просто белое изображение размером 1500 * 1000, как показано выше, а тест — выше.
Это то, что я придумал, только недостаток, у меня есть третье изображение вместо только 2 ожидаемых, показывающих теневую зону...
Решение проблемы
Вот простой подход:
- Загрузите изображение, преобразуйте изображение в оттенки серого и размойте по Гауссу.
- Выполнить обнаружение хитрых краев
- Увеличьте изображение, чтобы сформировать больший контур
- Перебирать контуры и находить ограничивающие рамки
- Извлеките ROI с помощью нарезки Numpy и сохраните изображение
Хитрое обнаружение краев
![](https://i.stack.imgur.com/MEshd.png)
Обнаруженные ROI
![](https://i.stack.imgur.com/V8qb3.png)
Чтобы извлечь ROI, вы можете найти координаты ограничивающей рамки с помощью cv2.boundingRect()
, обрезать нужную область, а затем сохранить изображение.
x,y,w,h = cv2.boundingRect(c)
ROI = original[y:y+h, x:x+w]
Первый объект
![](https://i.stack.imgur.com/Dem1a.png)
Второй объект
![](https://i.stack.imgur.com/15xSl.png)
import cv2
import numpy as np
image = cv2.imread('1.jpg')
original = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (3, 3), 0)
canny = cv2.Canny(blurred, 120, 255, 1)
kernel = np.ones((5,5),np.uint8)
dilate = cv2.dilate(canny, kernel, iterations=1)
# Find contours
cnts = cv2.findContours(dilate, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
# Iterate thorugh contours and filter for ROI
image_number = 0
for c in cnts:
x,y,w,h = cv2.boundingRect(c)
cv2.rectangle(image, (x, y), (x + w, y + h), (36,255,12), 2)
ROI = original[y:y+h, x:x+w]
cv2.imwrite("ROI_{}.png".format(image_number), ROI)
image_number += 1
cv2.imshow('canny', canny)
cv2.imshow('image', image)
cv2.waitKey(0)
Комментариев нет:
Отправить комментарий