스택큐힙리스트

지속 가능한 나의 AI 파드 답변의 일부로 이미지를 업로드하려면, HTML의 p 태그를 사용하여 GPT4의 API에 대한 프롬프트와 함께 이미지를 업로드하는 방법에 대해 알아보겠습니다. 본문

카테고리 없음

지속 가능한 나의 AI 파드 답변의 일부로 이미지를 업로드하려면, HTML의 p 태그를 사용하여 GPT4의 API에 대한 프롬프트와 함께 이미지를 업로드하는 방법에 대해 알아보겠습니다.

스택큐힙리스트 2024. 2. 3. 11:46
반응형

여기에는 다양한 이미지 생성 방법이 있는 것 같습니다: https://platform.openai.com/docs/api-reference/images


하지만 나는 그냥 png 파일을 챗 GPT에 보내고 이게 뭐에요? 또는 그런 식으로 물어보고 그에 대한 응답을 받으려고 합니다.

답변 1


  1. https://azure.microsoft.com/ko-kr/free에서 무료 Azure 계정을 생성하세요.

  2. portal.azure.com으로 이동하여 Computer vision을 검색하고 Computer vision을 클릭한 후 + 만들기 버튼을 클릭하여 자신의 Computer Vision 인스턴스를 만드세요.

  3. 필요한 세부 정보(하위 계정, 이름 등)를 입력하여 완료하세요.

  4. 키 관리: 여기를 클릭하여 키 및 엔드포인트 관리를 클릭하세요.

  5. Key 1과 Endpoint 값 저장하세요.


이제 다음과 같이 curl 요청을 할 수 있습니다:


url = https://upload.wikimedia.org/wikipedia/commons/thumb/1/12/Broadway_and_Times_Square_by_night.jpg/450px-Broadway_and_Times_Square_by_night.jpg
image_analysis = client.analyze_image(
url, visual_features=[VisualFeatureTypes.tags])

전체 코드 예제는 다음 replit의 링크에서 확인할 수 있습니다: https://replit.com/@allenmcgehee/HonoredCarefulBackticks#main.py

답변 2

어떻게 GPT-4의 API를 통해 이미지와 함께 컨텍스트를 업로드할 수 있을까요? 이미지를 컨텍스트와 함께 GPT-4의 API에 전달하기 위한 방법을 알아보겠습니다.
GPT-4는 이미지 이해 기술을 통해 이미지와 텍스트를 결합하여 다양한 작업을 수행하는 강력한 언어 모델입니다. 그러나 GPT-4의 API는 현재 텍스트만을 입력으로 받도록 설정되어 있습니다. 그렇다면 이미지를 컨텍스트와 함께 API에 업로드하려면 어떻게 해야 할까요? 여기에 몇 가지 단계가 있습니다.
1. 이미지를 텍스트로 변환하기: API에 이미지를 업로드하려면 이미지를 텍스트로 변환해야 합니다. 이를 위해 OCR(광학 문자 인식) 기술을 사용할 수 있습니다. OCR은 이미지에서 텍스트를 인식하고 추출하는 기술로, Python 라이브러리인 Tesseract 등을 사용하여 이미지를 텍스트로 변환할 수 있습니다.
2. 텍스트와 이미지를 결합하기: 변환된 텍스트와 이미지를 하나로 결합하여 API에 제출해야 합니다. 텍스트를 작성한 후, 이미지에서 추출한 텍스트를 특정 형식으로 추가합니다. 예를 들어, 텍스트와 이미지 경로를 특정 구분자로 구분하여 하나의 문자열로 만들 수 있습니다.
3. API에 쿼리 전송하기: 결합된 텍스트와 이미지 정보를 GPT-4 API에 POST 요청으로 전송합니다. 주의해야 할 점은, GPT-4 API에는 텍스트와 이미지의 최대 길이 제한이 있을 수 있으므로, 제출할 데이터의 크기를 알맞게 조정해야 합니다.
4. 결과 받기: API 요청 후, GPT-4 모델은 입력된 텍스트와 이미지를 기반으로 응답을 생성합니다. API 요청에 대한 응답은 JSON 형식으로 반환되며, 여기에서 결과를 추출하고 활용할 수 있습니다.
이처럼 이미지를 GPT-4의 API에 컨텍스트로 업로드하는 방법을 알아보았습니다. OCR 기술을 사용하여 이미지를 텍스트로 변환한 후, 변환된 텍스트와 이미지를 결합하여 API에 전송합니다. 이를 통해 GPT-4은 텍스트와 이미지를 활용한 다양한 작업을 수행할 수 있습니다.

반응형
Comments