본문 바로가기

공부쓰

(17)
mobaXterm rendering error sol~! 다들 각자의 방식으로 원격으로 rendering을 사용하는데, 나같은 경우네 mobaxterm을 사용한다. 개인적으로 이걸 빨리 접해서 팀뷰어를 사용하진 않는데 굉장히 편리하다. 그런데 어느 순간 갑자기 아래와 같은 문구가 떴다. MoTTY X11 proxy: unable to connect to forwarded X server: Network error: Connection refused Error: Can't open display: localhost:10.0 연결이 끊긴 것 같아서 xming을 다시 실행시켜주었다. 만약 이런 문구가 없이 연결이 안된다고 뜬다면 localhost:10.0을 11.0 으로 변경하는 것도 추천한다. 그랫더니 이번에 ERROR: ld.so: object '/usr/lib..
[IROS 2020] Learning Motion Parameterizations of Mobile Pick and Place Actionsfrom Observing Humans in Virtual Environments Learning Motion Parameterizations of Mobile Pick and Place Actions from Observing Humans in Virtual Environments (papercept.net) Abstract 이 논문은 robot acting에 대한 가상 환경에서의 데이터를 실제 환경에서 로봇에 이전하여 그에 따라 성공적인 작업을 수행하기 위한 접근 방식과 파이프 라인을 제시한다. Introduction 실제 환경에서 집안일과 같은 태스크를 풀기 위해선 다양한 데이터가 필요하다. 예를들어 아침을 차린다면, 어떤 물건을 어디에 두어야하는지 혹은, 어디에서 그 물건을 찾아야하며, 어떻게 물건을 잡는지 등등.. 이런 지식들은 각 작업에 대한 전문적인 추론을 작성하거나 문제..
[CoRL 2019]Meta-World: A Benchmark and Evaluation for Multi-Task and Meta Reinfo 오랜만에 논문을 블로그에 포스팅한다. Meta-reinforcement learning 에 대한 흐름을 보려고 찾아본 논문이다. Keywords: #meta-learning, #multi-task reinforcement learning, #benchmarks https://arxiv.org/pdf/1910.10897.pdf Abstract : 이 논문에서는 open-source simulated benchmark를 제시한다. 완전히 새롭게 행해진 태스크를 통해 가속화하여 개발할 수 있는 알고리즘을 개발하는 것이 목표. Meta reinforcemnt learning과 muli-task learning의 7개의 sota(state of the art) 모델을 사용해서 평가했는데 성공적으로 학습했다. 1 ..
rosbag 데이터를 image로! 해체 여정기~ 1. Ros 설치 Ubuntu 18.04기 때문에 ROS Melodic을 깔아야햇다! 아래 블로그를 참조! 👏 https://whiteknight3672.tistory.com/248 Ubuntu 18.04 + ROS Melodic 설치 방법 정리 필요한 우분투와 ROS 버전 확인 설치 전, 리눅스 버전에 대해 설명드리겠습니다. ROS는 Debian, Windows 10 등 다양한 OS에서의 작동을 지원하지만 Ubuntu를 공식지원하며, Ubuntu 환경을 이용하는 유저가 whiteknight3672.tistory.com 2. 환경 만들기! python version 3.7으로 conda env 생성 : ROS 때문이었던 것 같은데 이유를 까먹었다. conda create -n data python=3.7..
영어 작문에 도움되는 강의 추천 (Coursera) www.coursera.org/learn Writing in the Sciences 스탠퍼드 대학교에서 제공합니다. This course teaches scientists to become more effective writers, using practical examples and exercises. Topics include: ... 무료로 등록하십시오. www.coursera.org 수업 때문에 듣게된 강의다. Coursera에 계정만 있으면 무료로 들을 수 있고, 내용도 쉽고 예시도 많아서 이해도 빠르다. 벌써 몰랐던 내용을 요리조리 많이 배운 것 같다. 오랜만에 영어 공부하니까 재미있다. 원어민들 영어잘하는거 너무너무너무 부럽다 :)
2021.03.31 TODO LIST 보호되어 있는 글입니다.
[ICLR 2018] Intrinsic motivation and automatic curricula via asymmetric self-play Intrinsic Motivation and Automatic Curricula via Asymmetric Self-Play 0. Abstract Alice와 Bob이라는 이름으로 똑같은 agent를 상대방에 대항하도록 배치한다. Alice는 Bob이 풀어야할 태스크를 제시하고, Bob은 task를 완수한다. Alice는 일련의 행동을 한 후 태스크를 "제안"하고 Bob은 그것들 취소하거나 반복한다. 적절한 보상을 통하여 Alice와 Bob은 자동으로 탐색 커리큘럼을 출력하여 unsupervised 학습이 가능하도록 한다. 1. Introduction model-free RL 접근법은 많은 양의 샘플을 사용한다는 점에서 비효율적이다. 명확한 환경 모델이 없다는 것은 agent가 반드시 밑바닥부터 환경을 ..
연구 계획 + 브레인스토밍 보호되어 있는 글입니다.
[CoRL 2020] Learning Latent Representations to Influence Multi-Agent Interaction #multi-agent system, #human-robot interaction, #reinforcement learningarxiv.org/pdf/2011.06619 Abstract 끊임없이 사람이나 로봇이 연결되는 것은 어렵다 왜냐면 agent는 정지되지 않은 상태이기 때문이다. 사람에게 영감을 받아 로봇이 명확한 모델이 모든 low-level 액션에 필요하지 않다는 것을 깨달았다. 대신에 latent strategy를 high-level agent에서 뽑아낸다. ego agent가 그것의 행동과 다른 agent들의 미래 strategy의 관계를 인지하는 강화학습 기반의 프레임워크를 제안한다. ego agent는 이런 latent 역학을 다른 agent에게 영향을 끼치고 결과적으로 그들을 같이 적응..
대망(大亡)의 SAC(Soft Actor-Critic) 논문 정리 Soft Actor-Critic은 정말 연이 깊은 알고리즘이다.잇님들의 꾸준한 요청이 있었던 (자신감이 떨어져 올리고 싶지 않았던) sac 논문 정리를 올려본다.수식이 많은 논문은 내용이 어떻든 읽는데 속도가 너무 오래 걸리는 것 같다!하지만 열심히 썼으니 누군가에게는 도움이 되기를 >_
xml로 로봇 모델 커스터마이징 해보기~!(진행중) 보호되어 있는 글입니다.
mujoco, gym 설치 및 설치 확인 1. 서버에 우선 mujoco 설치 확인 하기 2. mujoco 200 설치하기 설치 참조 링크 yongjin-shin.github.io/blog/tip2/ mujoco, gym 설치하기 버클리 CS294_112 강좌를 들으면서 과제를 하다가 시뮬레이션 환경을 설치해야되어서 이것저것 시간 날려먹은게 아까워서 기록해둔다. 가상환경이 엉망이 되어버리면 또다시 설치해야하므로…ㅋ yongjin-shin.github.io github.com/openai/mujoco-py openai/mujoco-py MuJoCo is a physics engine for detailed, efficient rigid body simulations with contacts. mujoco-py allows using MuJoCo f..

반응형