DQ Life/Book Reading Archive

[독서] 머신러닝을 다루는 기술 with 파이썬, 사이킷런

디큐로그 2021. 1. 2. 01:11
728x90

들어가며...

 

머신러닝 패키지인 사이킷런의 활용 방법을 조금 더 깊게 공부하고, 

이를 바탕으로 실무에 적용해보고자 이 책을 선택하게 되었다. 

 

 

총평

솔직히 머신러닝 / 파이썬 코드를 처음 접하는 사람에게는 추천하기가 어려울 듯 하다.

기본적인 파이썬 코드에 대한 이해도는 필요할 듯, 초급 설명에 대한 부분이 생략되어있다.

반대로 말하면 장점인 것이 중, 고급 사용자들의 경우에는 책에 그런 기본적인 내용이 설명되어있는게 지면 낭비라고 생각할 수 있기 때문에 책의 내용이 알찬 점이 장점이다.

또한 코드의 예제만 쭉 나열되어있는 것이 아닌 머신러닝에서 필요한 기본적인 수학/이론적인 설명을 시각화 자료와 덧붙여서 설명해주기 때문에 기초적인 내용에 대해서 쿡북 형태로 사용이 가능해보인다. (저자의 다년간 강의 노하우가 쌓인 흔적이 보이는 듯 하다)

 

장점

이 책에서 얻을 수 있는 내용은 아주 많지만, 그 중에서도 빠르게 얻어갈만한 것이 크게 2가지 있는데, 첫번째는 mlwpy 코드이다. 실습을 편하게 해주기 위해서 이미 만들어둔 코드를 기반으로, 필요한 파이썬 모듈을 하나씩 import 하는 것이 아닌 하나의 코드에 모두 정의해두었다. 이는 실습하는 과정에서 시간을 꽤나 단축해주었고, 버전이나 호환성 문제도 (거의) 없어서, 빠르게 이 책의 내용을 훑어보는데에 도움을 주었다.

두번째는 실무에서 적용이 가능한 각종 노하우들이다. 책 후반부에 자세하게 설명되어있는데, 특성 엔지니어링 (feature engineering), 하이퍼 파라미터 튜닝, 특정 상황에서의 전략들이 꽤나 실무에서 자주 접할 수 있는 케이스들로 구성되어있다. 만약 이 책을 읽지 않은 상태에서 실무에 머신러닝을 도입한다면 시간을 많이 들여 고쳐야할 문제들을 미리 다양한 케이스로 접할 수 있고 그로 인해 실무에 적용할때 생각해볼 케이스들을 미리 알려준다는 점에서 이 책의 값어치는 책 값 이상 한다고 본다. 

 

단점

다만 아쉬운 점이 있다면, 머신러닝의 특성상 영어로 서치해야할 일이 많은데, 용어들이 모두 한국어로 번역되어있다보니 실무에서 구글링할때 약간 번거로울 것 같다는 생각이 든다. 자주 쓰이는 용어들에 대해서는 영어를 병기해주는 게 어떨까 하는 작은 의견을 내본다.

 

 

도움이 되셨다면 카누 한잔 어떠신가요?

카누로부터 돈을 받지는 않았지만 제가 카누를 좋아합니다. 
 “파트너스 활동을 통해 일정액의 수수료를 제공받을 수 있음"

 

반응형