분류 전체보기
![[논문 리뷰] Human-level Control through Deep Reinforcement Learning (DQN)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbzkKGm%2Fbtr6OnaYcEO%2FE8CFMeOOk8xPvX6vz5YBG0%2Fimg.png)
[논문 리뷰] Human-level Control through Deep Reinforcement Learning (DQN)
Human-level control through deep reinforcement learning | Nature 이번에는 Nature지에 발표된 DQN관련된 논문을 리뷰해보고자 한다. Playing Atari with Deep Reinforcement Learning과 거의 같은 저자들이 작성을 했는데 이는 그전 논문에서 여러 가지 실험이 추가된 것이다. 그래서 DQN에 관한 것을 알고 싶다면 밑에 있는 링크를 타고 들어가 읽으면 된다. 이번 리뷰에서는 추가된 실험들만 다루겠다. [논문 리뷰] Playing Atari with Deep Reinforcement Learning (DQN) — LimePencil's Log (tistory.com) [논문 리뷰] Playing Atari with Deep..
![[논문 리뷰] Playing Atari with Deep Reinforcement Learning (DQN)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fbyqg4Y%2Fbtr4TKku7LE%2FVk0yFugIFrfuOZuYWulKt0%2Fimg.png)
[논문 리뷰] Playing Atari with Deep Reinforcement Learning (DQN)
이제부터 이 블로그에 논문을 하나씩 읽으면서 리뷰를 해보려고 한다. 아마 분야마다 시간을 순서대로 큰 영향을 미친 논문을 읽을 것 같다. 이번 논문은 강화학습에 DL을 적용한 첫 번째 성공적인 연구인 Playing Atari with Deep Reinforcement Learning을 읽어보려고 한다. 코드 구현은 다른 글로 해보겠다. [1312.5602] Playing Atari with Deep Reinforcement Learning (arxiv.org) Playing Atari with Deep Reinforcement Learning We present the first deep learning model to successfully learn control policies directly fr..
2023년도 공부 계획
학기가 시작하고 2주가 지났다. 부캠이 끝난 이후에 코딩과 공부를 조금 멀리 했는데, 대충 1달 정도 쉰 것 같다. 2023년도에는 다양한 경험과 공부를 하면서 지내고 싶은데, 이에 대한 계획을 조금 써보자 한다. Problem Solving과 Competitive Programming 실력 늘리기 대학 입시와 부스트캠프 때문에 문제풀이에 소홀한 감이 없지않아 있는데, 이번 연도에는 확실한 목표를 정해보자 한다. Solved.ac: 다이아 4~5정도 Codeforces: 블루 또는 AtCoder: 민트 상위 아무래도 현재 파이썬의 한계를 느꼈기 때문에 C++로 1학기에 갈아타서 공부해볼까 한다. 그렇게 한다면 2학기에 있을 자료구조 수업에도 도움이 될 것 같다. 인공지능 공부 PoolC에 가입한 덕분에 ..
![부스트캠프 AI Tech 4기를 마치며... feat. 부캠 참가를 고려하시는 분들을 위해](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbvM8A5%2Fbtr1KPK7UTZ%2FN0tvFrjjZEmAzEaesvrxJK%2Fimg.png)
부스트캠프 AI Tech 4기를 마치며... feat. 부캠 참가를 고려하시는 분들을 위해
부스트캠프 AI Tech 4기가 2월 14일부로 끝이 났다. CV 트랙으로 들어왔고, 3개의 레벨과 2개의 팀을 지나 수료를 했다. 부캠에 대해 조금만 서술하자면 현재 대학민국에 존재하는 인공지능 전문가 양성 프로그램 중에 강사나 커리큘럼으로 봐도 1등이라고 생각한다. 네이버라는 대기업이 주는 신뢰감과 전문적인 수업들이 실제 현업과 유사하게 이루어지기 때문에 상당히 좋았다고 생각한다. 뭐니 뭐니 해도 사실상 제일 좋았던 건 1인 1 고성능 GPU서버를 제공한다는 것이었다. V100 32Gb GPU를 한 2~3달 정도 제공했는데 저장공간이 조금 적은 것 빼고 배우는 학생에 입장에서는 최상의 장비라고 생각한다. 들어가 있던 Xeon CPU도 좋았고 램도 저장공간만큼 있었다. 개인 서버가 있다 보니 24시간 ..
리액트 공부 정리
사용한 기술 스택들: React - 생활코딩 리액트 특징: 사용자 정의 태그 만들기 src/index.js 에서 쓰여 있는 데로 npm start가 작동됨 npm run build를 실행하면 빌드가 되고 npx serve -s build를 그다음에 실행하면 배포용 웹이 실행이 된다 태그들의 모음을 함수로 만들고 그 함수를 또 다른 태그/컴포넌트로 사용이 가능하다 prop: 우리가 만든 태그의 속성 - kwargs느낌이라고 생각하면 될듯하다 속성을 출력 하려면 중괄호 안에 넣어줘야 제대로 된다. 중괄호가 없으면 object가 아니라 string이 전달됨 자동으로 react에서 생성한 값들은 key라는 prop이 있어야지 성능이 올라간다 state를 사용해서 이미 정의된 변수의 값을 변화시켜 페이지에 반영을..