목록강화학습 (4)
스택큐힙리스트
잠금 상태. 이 질문과 그 답변들은 역사적인 의의가 있음에도 불구하고 주제에서 벗어난 내용으로 인해 잠금상태에 있습니다. 현재 새로운 답변이나 상호작용을 받지 않고 있습니다. 새로운 오픈 소스 포커 봇인 PokerPirate이 있습니다. 웹 응용 프로그램이 포커 봇을 탐지/방해/무력화하는 창의적인 방법에 대해 관심이 있습니다. (이는 순수히 학문적인 토론이며, PokerPirate가 작성된 것과 동일한 정신을 가지고 있습니다.)답변 1당신이 본인의 봇 또는 게임을 상위 레벨로 옮기면, 더 숙련된 플레이어들의 많은 인구에 마주치게 될 것입니다. 그럼에도 불구하고, 전략의 복잡성은 다음 레벨로 올라가야 할 것입니다. 이때에는 테이블 이미지, 레인지 밸런싱, 정교하고 지능적인 블러핑(약함에만 블러핑하는 것이 ..
나는 항상 AI와 진화 알고리즘에 대한 아이디어를 좋아했습니다. 불행하게도, 우리가 아는 바와 같이, 이 분야는 초기에 예상보다 훨씬 느리게 발전해 오지 못했습니다. 제가 찾고 있는 것은 와우 효과를 주는 몇 가지 예시입니다. 예기치 않은 방식으로 적응한 자기 학습 시스템. 특히 동적이고 예상치 못한 전략을 사용한 게임 에이전트. 실제로 의미있고 통찰력 있는 결과물을 만들어낸 상징적 표현 시스템. 다중 에이전트 시스템에서의 흥미로운 비례적 행동. AI를 정의하는 의미론에 대해서 논하지 맙시다. 만약 그것이 AI처럼 보이거나 들린다면, 그에 대해 이야기합시다. 첫 번째로, 1997년의 이야기부터 가볼까요?드. 에드리안 톰슨은 유전 알고리즘을 사용하여 FPGA에 음성 인식 회로를 작성하려고 시도하고 있습니다..
>>> import atari_py 추적 불가능한 가장 최근 호출 (지난 시간을 표시하지 않음): 파일 , 라인 1, in 파일 C:\Users\ssit5\AppData\Local\Programs\Python\Python38\lib\site-packages\atari_py\__init__.py, 라인 1, in from .ale_python_interface import * 파일 C:\Users\ssit5\AppData\Local\Programs\Python\Python38\lib\site-packages\atari_py\ale_python_interface.py, 라인 17, in ale_lib = cdll.LoadLibrary(os.path.join(os.path.dirname(__file__), 파..
저는 산업용 로봇을 신경망으로 운전할 수 있도록 연구 중입니다. 지금까지는 잘되고 있습니다. OpenAI 기반 PPO 알고리즘을 사용하여, 다음과 같은 보상 전략을 사용하여 쉽게 지점에서 지점으로 주행할 수 있습니다:나는 대상과 위치 사이의 정규화된 거리를 계산합니다. 그리고 그것과의 거리 보상을 계산합니다. rd = 1-(d/dmax)^a각 시간 단계마다, 저는 에이전트에게 계산된 벌칙을 부여합니다. yt = 1-(t/tmax)*ba와 b는 조정해야하는 하이퍼파라미터입니다.내가 말한대로, 이것은 지점에서 지점으로 운전하려면 정말 잘 작동합니다. 하지만 무언가 주위를 돌아다니려면 어떻게 될까요? 제 일상적인 일에서, 충돌을 피하기 위해 물체 주위를 운전해야 할 필요가 있습니다. 물체가 가장 가까운 경로의..