복수의 에이전트들을 이용한 행동 정책 결정 장치 및 방법

BioChem - DOS

Search

메타 데이터

바이오화학분류

- 바이오플라스틱
  1. 플라스틱
- 바이오정밀화학
  1. 용매
  2. 화학제품
  3. 연료
- 화장품용 기능성소재
  1. 계면활성제⁄증점제
- 의료용 화학소재
  1. 식품첨가제

특허명

복수의 에이전트들을 이용한 행동 정책 결정 장치 및 방법

국가

대한민국

초록

일 측면에 따른 복수의 에이전트들의 행동 정책 결정 방법은, 복수의 에이전트들에 포함되는 제 1 에이전트에 의해 관측된 감각 정보로부터 추출되며, 상기 제 1 에이전트의 행동을 결정하기 위해 필요한 특성 정보를 나타내는 제 1 수신 특성 정보 값을 획득하는 단계, 상기 복수의 에이전트들 각각에 의해 관측된 감각 정보로부터 추출되며, 상기 복수의 에이전트들 각각에 의해 관측된 특성 정보를 나타내는 복수의 송신 특성 정보 값을 획득하는 단계, 상기 제 1 수신 특성 정보 및 상기 복수의 송신 특성 정보들에 기초하여, 상기 복수의 감각 정보들 각각의 가중치를 결정하는 단계 및 상기 복수의 감각 정보들 및 상기 복수의 환경들 각각에 대응하는 가중치에 기초하여, 상태 행동 가치 함수에 따라 산출되는 복수의 행동들의 보상 정보를 미리 학습한 상태 행동 가치 함수 인공신경망을 통해 상기 제 1 에이전트의 행동을 결정하는 단계를 포함할 수 있다.

IPC코드

G06N

출원번호

1020180005267

출원일자

2018-01-15

공개번호

1020190087023

공개일자

2019-07-24

출원인

국방과학연구소