목록딥러닝 (38)
스택큐힙리스트
저는 현재 Python을 배우는 과정에 있습니다. 저는 pass 문장에 관한 섹션에 도달했습니다. 저는 사용하고 있는 가이드에서 이를 자리 표시자로 자주 사용되는 빈 문장으로 정의합니다.하지만 아직은 정확히 그게 무슨 뜻인지 이해하지 못하겠어요. pass 문장을 사용하는 간단하고 기본적인 상황과 왜 필요한지에 대해서 얘기해주세요.답변 1당신은 구현하고 싶지 않은 몇 가지 메소드가 있는 새로운 클래스를 디자인하고 있다고 가정해보세요. class MyClass(object): def meth_a(self): pass def meth_b(self): print I'm meth_b만약 pass 를 제외하면 코드가 실행되지 않을 것입니다.그럼 당신은 다음과 같이 얻게 됩니다: IndentationError: ex..
저는 미세 조정에 대한 this OpenAI tutorial를 따르고 있습니다.저는 이미 OpenAI 도구로 데이터셋을 생성하였습니다. 문제는 출력 인코딩(추론 결과)이 UTF-8과 비-UTF-8 문자가 섞인다는 것입니다.생성된 모델은 이렇게 보입니다: {prompt:Usuario: Quién eres\\nAsistente:,completion: Soy un Asistente\n}{prompt:Usuario: Qué puedes hacer\\nAsistente:,completion: Ayudarte con cualquier gestión o ofrecerte información sobre tu cuenta\n}예를 들어, ¿Cómo estás?라고 묻는다면, 훈련된 문장 Estoy bien, ¿y tú..
저는 산업용 로봇을 신경망으로 운전할 수 있도록 연구 중입니다. 지금까지는 잘되고 있습니다. OpenAI 기반 PPO 알고리즘을 사용하여, 다음과 같은 보상 전략을 사용하여 쉽게 지점에서 지점으로 주행할 수 있습니다:나는 대상과 위치 사이의 정규화된 거리를 계산합니다. 그리고 그것과의 거리 보상을 계산합니다. rd = 1-(d/dmax)^a각 시간 단계마다, 저는 에이전트에게 계산된 벌칙을 부여합니다. yt = 1-(t/tmax)*ba와 b는 조정해야하는 하이퍼파라미터입니다.내가 말한대로, 이것은 지점에서 지점으로 운전하려면 정말 잘 작동합니다. 하지만 무언가 주위를 돌아다니려면 어떻게 될까요? 제 일상적인 일에서, 충돌을 피하기 위해 물체 주위를 운전해야 할 필요가 있습니다. 물체가 가장 가까운 경로의..
OpenAI의 API fine tuning 엔드포인트는 상당히 새로운 것으로 보이며, 온라인에서 파인튜닝 데이터셋의 많은 예제를 찾을 수 없습니다.저는 보이스봇을 책임지고 있으며, 일반적인 열린 대화 질문에 대한 GPT-3의 성능을 테스트하고 있습니다. 저는 현재 사용하고 있는 고정 의도-응답 쌍에 대해 모델을 train하고 싶습니다. 이는 회사의 음성과 스타일 측면에서 더 나은 성능을 발휘할 것으로 보입니다.저는 우리 현재 대화 엔진에서 추출한 데이터의 긴 JSON 파일을 가지고 있습니다. 이 파일은 사용자 입력을 의도와 일치시키고 지정된 응답을 반환합니다. 이 데이터를 기반으로 GPT-3 모델을 훈련시키고 싶습니다.현재는 빠른 테스트를 위해 API에 대한 내 호출을 그냥 그들이하기와 같이 설정했습니다..