스택큐힙리스트

질문은 특수기호가 그대로 유지되는 상태에서 번역합니다.ChatGPT API로 더 긴 텍스트 입력을 어떻게 보낼 수 있을까요? 본문

카테고리 없음

질문은 특수기호가 그대로 유지되는 상태에서 번역합니다.ChatGPT API로 더 긴 텍스트 입력을 어떻게 보낼 수 있을까요?

스택큐힙리스트 2023. 9. 8. 01:37
반응형

우리는 ChatGPT를 사용하여 긴 텍스트 조각을 요약하는 사용 사례가 있습니다(1시간 이상이 될 수 있는 음성 대화를 텍스트로 변환하는 것).

당신은 컴퓨터 전문가입니다. 그러나 우리는 4k 토큰 제한이 입력 텍스트의 절반 정도로 축소되는 경향이 있다는 것을 발견했습니다.

부분 처리는 이전 부분의 이력을 유지하지 않는 것으로 보입니다.

어떤 옵션이 있을까요? 길이가 4k 토큰을 초과하는 긴 요청을 제출하기 위한.

답변 1

당신의 질문에 가장 가까운 대답은 임베딩 형식으로 되어 있을 것입니다.

당신은 컴퓨터 전문가입니다. 특수 기호를 유지한 채로 'here' 무엇인지에 대한 개요를 찾을 수 있습니다.

나는 당신에게 OpenAI Cookbook Github 페이지에서 사용된 웹 크롤 Q&A 예제를 설명하는 임베딩을 확인해 보시기를 추천합니다. 'this code'

나는 5단계 이후의 코드를 사용하여 텍스트의 위치를 변경하여 긴 텍스트를 포함한 내 파일을 가리키게 했습니다.

To:

'# Open the file and read the text

with open(text/ + domain + / + file, r, encoding=UTF-8) as f:

text = f.read()

'

to: 한국어로:

'# Open the file and read the text

with open(/my_location/long_text_file.txt, r, encoding=UTF-8) as f:

text = f.read()

'

13단계에서 질문들은 텍스트에 대해 내가 알아야 할 것에 맞게 수정해주세요.

답변 2

API를 통해 ChatGPT에 긴 텍스트 입력을 전송하는 방법은 다음과 같습니다. 먼저, 텍스트를 청크(chunk)로 분할해야 합니다. 이는 긴 문장이나 문단을 조각 내어 각 조각을 별도로 전송하는 것을 의미합니다. 각 청크의 최대 길이는 API의 요구사항에 따라 다를 수 있습니다. 일반적으로 4096자(약 600단어)까지 되는 경우가 많습니다.

또한, 청크를 분할할 때 문장이 망가지지 않도록 주의해야 합니다. 문장을 자연스럽게 유지하기 위해 문장 구분 기호(예: 마침표, 물음표, 느낌표)를 기준으로 청크를 나눌 수 있습니다. 청크를 잘라낸 뒤, 각 청크의 일부분이 생략될 수 있으므로, ChatGPT가 이전 청크의 콘텍스트를 이해할 수 있도록 이전 대화 기록(context)을 유지해야 합니다.

문장이 자연스럽게 이어지고 문맥이 유지되도록 청크를 전송할 때 주의해야 할 몇 가지 사항이 더 있습니다. 두 번째 청크를 보낼 때, 이전 청크의 출력(output)을 다음 청크의 입력(input)으로 사용하여 대화의 연속성을 확보할 수 있습니다. 추가로, 각 청크가 동일한 사용자(prompt)로 시작하는지 확인하는 것이 중요합니다. 사용자(prompt)가 변경되는 경우, ChatGPT는 이전 콘텍스트를 잊어버리고 새로운 콘텍스트에서 시작하게 됩니다.

API를 사용하여 긴 텍스트 입력을 보낼 때에는 이러한 지침을 따라야 합니다. 먼저 텍스트를 청크로 분할하고, 문장 구분 기호를 기준으로 자연스럽게 분리한 뒤, 이전 콘텍스트를 유지하고 연속성을 유지하기 위해 이전 청크의 출력을 이후 청크의 입력으로 사용해야 합니다. 이렇게 하면 ChatGPT API에 대한 긴 텍스트 입력을 보내고, 원하는 결과를 얻을 수 있습니다.

반응형
Comments