본문 바로가기
개발/게임) 개발관련

GitHub)DuckDuckGo 이미지 크롤링하기

by 테샤르 2023. 4. 8.

DuckDuckGo에서 이미지 크롤링하기

 

Pyton으로 이미지를 크롤링하기에 가볍게 사용이 가능한 GitHub가 있어서 소개하고자 정리하는 포스팅이다.

 

 

<설치하기>

pip install jmd_imagescraper

 

Image 경로에 해당 json Data를 기반으로 20개의 이미지를 크롤링하는 코드이다.

 

<사용하기>

from jmd_imagescraper.core import * # dont't worry, it's designed to work with import *
from pathlib import Path
import json

root = Path().cwd()/"Image"

json_data = '''
{
     "fruit": [
      "apples",
      "bananas",
      "oranges",
      "grapes",
      "strawberries",
      "blueberries"
    ]
}
'''



json_dict = json.loads(json_data)
jsonLIst = json_dict["fruit"]



# loop through each sport in the list and call the duckduckgo_search function
for json in jsonLIst:
  duckduckgo_search(root, json, json, max_results=20)

 

반응형

간단하게 Google Colab을 통해서 해당 코드를 실행한 결과는 다음과 같다.

 

원하는 이미지 그룹과 이미지가 크롤링이 잘되는 것을 확인할 수 있다.

 

 

GitHub : [링크]

 

 

GitHub - joedockrill/jmd_imagescraper: Image scraping library for creating deep learning datasets

Image scraping library for creating deep learning datasets - GitHub - joedockrill/jmd_imagescraper: Image scraping library for creating deep learning datasets

github.com

 

★☆☆☆☆

 

반응형

댓글