본문 바로가기

📄논문리딩

(3)
[논문리딩] ChartOCR: Data Extraction from Charts Images via a Deep Hybrid Framework Abastract 차트 이미지들은 data visualization을 위해서 보통 사용된다. 차트 내용 이해를 위해서 자동으로 차트 values를 읽는 것은 가장 중요한 단계이다. 차트의 종류는 다양해서 pure rule-based data extraction 방법으로는 다루기 어렵다. 그러나 end-to-end deep learning solution을 적용하는 것은 특정한 차트 타입만 다루게 되므로 부적절하다. 다양한 type의 차트에서 data를 추출하는 ChartOCR 방법을 제안한다. deep framework와 rule-based methods를 합치면 만족스러운 일반화 능력을 달성할 수 있고 정확하고 의미 있는 중간 결과를 얻을 수 있다. chart 구성요소를 정의하는 key points를 ..
[논문 리딩] Efficient K-NN Playlist Continuation 본 글은 Efficient K-NN Playlist Continuation 논문을 읽고 제 생각대로 정리한 글입니다. Abastract RecSys Challenge 2018 competition의 main track leaderboard에서 9등을 차지한 solution을 제안한다. track 및 palylist metadata와 함께 playlist-track matrix를 사용하여 music playlist을 완성하는 a light-wight playlist-based nearest neighbor method을 개발했다. 추천 품질 개선을 위해 다양한 도메인별 휴리스틱을 사용한다. 접근 방식의 주요 장점 중 하나는 컴퓨터 리소스 사용이 적다는 것이다. 최종 솔루션은 한 시간 내에 기존의 데스크톱 ..
논문 읽기에 대한 조언 by 앤드류 응 논문 읽는 방법 1. 논문 제목(title)과 초록(abstract), 도표(figures)를 먼저 보자 논문의 제목과 초록, 핵심 아키텍쳐 그림설명과 실험연구 부분을 읽고나면 논문의 기본적인 컨셉과 아이디어를 알 수 있을 것이다. 특히나 딥러닝 계열의 논문은 한두 개의 도표로 여러개의 논문을 정리하기 때문에 처음부터 끝까지 논문 텍스트를 다 읽어볼 필요는 없다. 2. 도입(introduction), 결론(conclusion), 도표(figures)를 읽고 필요없는 부분은 생략하자 도입과 결론, 초록에는 저자가 논문 리뷰어들에게 왜 자신의 논문이 게재 승인되어야 하는지 명확히 설명하기 위해 신중하게 요약한 내용이 담겨 있다. 그리고 관련된 다른 연구에 대한 부분은 가능하면 생략하자. 이 부분은 저자의 연..