혼자 공부하는 머신러닝+딥러닝

ace***l2023-04-27

머신러닝, 딥러닝을 시작함에 있어서 첫 디딤돌이 될 수 있는 책

onedayi***l2023-04-23

혼자 공부하는 머신러닝+딥러닝

rudfh1***l2023-04-23

혼자 공부하는 머신러닝+딥러닝

tjdwns0***l2023-04-23

[책] 혼자 공부하는 머신러닝+딥러닝(박해선): 수식없이 이해하기 쉬운 머신러닝 교과서

# 내용

한줄 요약:

머신러닝과 딥러닝에 대한 교과서

KeyPoint:

모든 챕터에서 코드기반으로 설명하며, 복잡한 수식 없이 이해가 쉬움
저자가 제공하는 예제 소스로 손쉽게 따라할 수 있음
- [Github] 예제 소스: https://github.com/rickiepark/hg-mldl
- [Google Colab] 예제 소스: https://colab.research.google.com/github/rickiepark/hg-mldl
저자 직강 유튜브 강의로 책에서 이해하기 힘든 내용을 강의로 학습할 수 있음
- [Youtube]혼자 공부하는 머신러닝+딥러닝: https://www.youtube.com/playlist?list=PLJN246lAkhQjoU0C4v8FgtbjOIXxSs_4Q

# 느낀 점

혼자 공부하는 머신러닝과 딥러닝 책은 머신러닝과 딥러닝을 처음 접하는 사람에게 적극 추천하고 싶은 책이다. 머신러닝을 처음 공부할 때 가장 막막한 부분이 수식이며 이로인해 많이 포기하곤 하는데, 이 책에서는 최대한 수식을 다루고 있지 않은 점에서 정말 추천하고 싶다. 물론 그렇다고 빠져있는 부분이 있는 것도 아니다. 기초를 이해하는 데 충분한 서적인 것 같다.

추가로, 책에 대해 궁금한 점이 있으면 오픈 채팅(암호: flow)이나 구글 그룹 Q&A를 통해 바로 답변을 해주신다고 하니 정말 혼자 공부하기 편한 서적같다.

youtaek***l2023-04-23

[서평] 혼자 공부하는 머신러닝+딥러닝

혼자 공부할 수 있도록 도와주는 혼공단 시리즈의 야심작 혼자 공부하는 머신러닝 + 딥러닝입니다. 처음 이 책을 받았을 때 당황했는데, 책의 두께는 약 530쪽으로 무섭도록 두껍습니다. 그렇지만 이러한 내용은 초보자들도 이해하기 쉽도록 가르치니 너무 걱정하지 않으셔도 됩니다.

책 서두에서 파이선 기본 문법과 배울 의지만 있으면 충분하다는 말과 함께 다양한 이야기를 통해 머신러닝의 세계를 풀어나갑니다. 예를 들어 레드 와인과 화이트 와인을 잘 구별할 수 있는 모델을 만들었는데, 이러한 모델 검증을 테스트 케이스에만 의존하지 않고 객관적으로 검증할 수 있게 만드는 방법을 검증 세트라고 하는 점처럼 일상생활 속에서 찾아볼 수 있는 다양한 예제를 통해 이를 설명하고 있습니다.

또한 구글 코랩을 사용하면서 실습을 쉽게 하면서 배워나갈 수 있고, 이를 그림과 설명을 통해 자세하게 풀어나가고 있습니다. 또한, 각 단계에서 손 코딩으로 직접 해당 문제를 입력해서 풀어보는 시간을 가지며, 기억할 수 있도록 돕는데, 이 점이 마음에 들었습니다.

각 장에서도 앞서 말한 이야기에 대한 문제해결 과정을 열거하듯이 설명하며 이와 비슷한 다른 프로젝트에도 어떻게 적용해야 할지 사고하는 방법을 기르고, 이를 장 마지막 장에서 핵심 요약과 함께 확인 문제를 풀며 복습할 수 있게 만들었습니다.

또한 실습 예제를 내려받아 손 코딩에서 에러가 날 시에 이와 비교해서 진행할 수 있고, 온라인 강의도 제공되어 있기에 막히는 부분은 해당 강의 영상을 접하며 알아가시면 좋을 것 같습니다.

물론 과목이 과목인 만큼 쉽게 가르친다고 하지만서도 어려운 부분이 존재하는 건 당연합니다. 그리고 그만큼 많이 헤매실 수도 있습니다. 그래도 끈기를 가지고 계속 나아가시다 보면 GPT의 기초를 이해할 만큼 성장하실 수 있으리라 믿습니다.

<< 이 글은 한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다. >>

j767a***l2023-04-23

[나는 리뷰어다] 혼자 공부하는 머신러닝+딥러닝

ttme***l2023-04-23

[나는 리뷰어다] 한빛미디어, 혼자 공부하는 머신러닝, 딥러닝

moon***l2023-04-23

[도서리뷰] 혼자 공부하는 머신러닝 + 딥러닝

혼자 공부하는 머신러닝 + 딥러닝

홍공머신 : 혼자공부하는 일에 능숙한 사람 혹은 그런 무리를 일컫는 신조어

이 책은 이론과 방식 설명에 예를 들어 설명해줘 접근이 쉽도록 도와주는 책으로 비전공자도 입문서로 활용하기에 좋은 책입니다. 책 안에 학습로드맵이 있어서 어떤 부분을 건너뛰고 어떤 부분을 집중적으로 봐야 하는지가 설명이 되어 있어서 인상적이었습니다.

혼자 공부하는 7단계 길잡이

핵샘키워드 : 해당 절에서 집중적으로 볼 내용을 확인
시작하기 전에 : 해당 절에서 배울 주제 및 주요 개념 설명
말풍선 : 지나치기 쉬운 내용 혹은 기억해야 할 내용
손코딩 : 코드를 직접 손으로 입력하고 실행
문제해결 과정 : 이 내용을 통해 실제 프로젝트에서 문제를 해결할때 어떤 사고 과정을 거치는지 확인
핵심 포인트/패키지와 함수 : 핵심포인트, 핵심 패키지와 함수를 통해 핵심 키워드를 리마인드하고, 중요한 함수의 기능 학습
확인문제 : 문제를 풀면서 지금까지 학습한 내용 확인

Chapter 1. 나의 첫 머신러닝

인공지능(AI)이란? 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술

머신러닝(Machine Learning)은 규칙을 일일이 프로그램하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야, 사이킷런이 대표적 라이브러리

딥러닝(Deep Learning)은 머신러닝 알고리즘 중에 인공신경망(Artificial Neural Network)을 기반으로 한 방법을 통칭, 텐서플로우, 파이토치가 대표적 라이브러리

구글 코랩(Colab)은 웹 브라우저에서 무료로 파이썬 프로그램을 테스트하고 저장할 수 있는 서비스로 클라우드 기반 주피터 노트북 개발환경입니다. 무료라 최대 5개 가상서버를 활용할 수 있습니다.

머신러닝에서 여러 개의 종류(or 클래스) 중 하나를 구별해 내는 문제를 분류(Classification)라고 하며 2개 클래스 중 하나를 고르는 문제를 이진 분류라고 합니다.

머신러닝 용어

특성 : 데이터를 표현하는 하나의 성질 (ex : 길이, 무게)
훈련 : 데이터에서 규칙을 찾는 과정
모델 : 알고리즘이 구현된 객체(or 알고리즘 자체)
정확도 : 정확한 답을 몇개 맞혔는지를 백분율로 나타낸 값 (ex, 사이킷런에서는 0~1 사이)

scikit-learn

KNeighborsClassifier() 는 k-최근접 이웃 분류 모델을 만드는 사이킷런 클래스로 기본값은 5
fit() : 사이킷런 모델을 훈련할 때 사용하는 메소드
predict() : 사이킷런 모델을 훈련하고 예측할 때 사용하는 메소드
score() : 훈련된 사이킷런 모델의 성능을 측정

Chapter 2. 데이터 다루기

머신러닝 알고리즘은 지도 학습과 비지도 학습으로 나눌 수 있습니다. 지도 학습 알고리즘은 훈련하기 위한 데이터와 정답이 필요하며, 비지도 학습은 타킷 없이 입력 데이터만 사용합니다.

머신러닝의 정확한 평가를 위해서는 테스트 세트와 훈련 세트가 따로 준비되어야 하며, 평가에 사용하는 데이터를 테스트 세트, 훈련에 사용하는 데이터를 훈련 세트라고 부릅니다.

훈련하는 데이터와 테스트 하는 데이터에는 데이터가 골고루 섞여 있어야 합니다. 일반적으로 골고루 섞여 있지 않으면 한쪽으로 치우치는 샘플링 편향(sampling bias)가 발생합니다.

훈련세트는 모델을 훈련할 때 사용하는 데이터로 보통 훈련 세트가 클수록 좋기 때문에 테스트 세트를 제외한 모든 데이터를 사용합니다.

테스트세트는 전체 데이터에서 20~30%를 테스트 세트로 사용하는 경우가 많으며 전체 데이터 아주 큰 경우에는 1%만 덜어내도 충분할 수 있습니다.

데이터 전처리는 머신러닝 모델에 훈련 데이터를 주입하기 전에 가공하는 단계를 말하며 때로는 데이터 전처리에 많은 시간이 소요된다.

표준점수는 훈련 세트의 스케일을 바꾸는 대표적인 방법 중 하나로 표준점수를 얻으려면 특성의 평균을 빼고 표준편차로 나눕니다. 반드시 훈련 세트의 평균과 표준편차로 테스트 세트를 바꿔야 합니다.

브로드캐스팅은 크기가 다른 넘파이 배열에서 자동으로 사칙 연산을 모든 행이나 열로 확장하여 수행하는 기능입니다.

Chapter 3. 회귀 알고리즘과 모델 규제

지도 학습 알고리즘은 크게 분류와 회귀로 나뉘어지고, 분류는 샘플을 몇 개의 클래스 중 하나로 분류하는 문제입니다. 회귀는 클래스 중 하나로 분류하는 것이 아니라 임의의 어떤 숫자를 예측하는 문제입니다.

두 변수 사이의 상관관계를 분석하는 방법 : 회귀(regression)

k-최근접 이웃 회귀 : k-최근접 이웃 알고리즘을 사용해 회귀 문제를 풀며, 가장 가까운 이웃 샘플을 찾고 이 샘플들의 타킷값을 평균하여 예측으로 삼습니다.

결정계수 : 대표적인 회귀 문제의 성능 측정도로 1에 가까울수록 좋고, 0에 가까울수록 성능이 나쁜 모델입니다.

과대적합 vs 과소적합

과대적합 : 모델의 훈련 세트 성능이 테스트 세트 성능보다 훨씬 높을 때 일어납니다. 모델이 훈련 세트에 너무 집착하여 데이터에 내재된 거시적인 패턴을 감지하지 못합니다.

과소적합 : 훈련 세트와 테스트 세트 성능이 모두 동일하게 낮거나 테스트 세트 성능이 오히려 더 높을 때 일어납니다. 이런 경우 더 복잡한 모델을 사용해 훈련 세트에 잘 맞는 모델을 만들어야 합니다.

선형회귀

널리 사용되는 대표적인 회귀 알고리즘으로 비교적 간단하고 성능이 뛰어납니다. 특성이 하나인 경우 어떤 직선을 학습하는 알고리즘입니다. (ex, LinearRegression)

모델 파라미터는 선형 회귀가 찾은 가중치처럼 머신러닝 모델이 특성에서 학습한 파라미터를 의미합니다.

다중회귀

여러 개의 특성을 사용하는 회귀모델입니다. 특성이 많으면 선형 모델은 강력한 성능을 발휘합니다.

특성공학 : 주어진 특성을 조합하여 새로운 특성을 만드는 일련의 작업 과정

릿지 : 규제가 있는 선형 회귀 모델 중 하나이며 선형 모델의 계수를 작게 만들어 과대적합을 완화

라쏘 : 또 다른 규제가 있는 선형 회귀 모델입니다. 릿지와 달리 계수 값을 아예 0으로 만들수 있습니다.

하이퍼파라미터 : 머신러닝 알고리즘이 학습하지 않는 파라미터, 이 파라미터는 사람이 사전에 지정해야 합니다.

Chapter 4. 다양한 분류 알고리즘

로지스틱 회귀

로직스틱 회귀는 이름은 회귀이지만 분류 모델입니다. 선형 회귀와 달리 시그모이드 함수나 소프트맥스 함수를 사용하여 클래스 확률을 출력할 수 있습니다.

다중분류는 타킷 클래스가 2개 이상인 분류 문제입니다. 로지스틱 회귀는 다중 분류를 위해 소프트맥스 함수를 사용하여 클래스를 예측합니다.

시그모이드 함수는 선형 방정식의 출력을 0과 1시아의 값으로 압축하며 이진 분류를 위해 사용합니다.

소프트맥스는 다중 분류에서 여러 선형 방적식의 출력 결과를 정규화하여 합이 1이 되도록 만듭니다.

확률적 경사 하강법

확률적 경사 하강법은 훈련 세트에서 샘플 하나씩 꺼내 손실 함수의 경사를 따라 최적의 모델을 찾는 알고리즘입니다. 샘플을 하나씩 사용하지 않고 여러 개를 사용하면 미니배치 경사 하강법이 됩니다. 한번에 전체 샘플을 사용하면 배치 경사 하강법이 됩니다.

손실함수는 확률적 경사 하강법이 최적화할 대상입니다. 대부분의 문제에 잘 맞는 손실 함수가 이미 정의되어 있습니다. 이진 분류에는 로지스틱 회귀 손실 함수를 사용합니다. 다중 분류에는 크로스엔트로피 손실 함수를 사용합니다. 회귀 문제에는 평균 제곱 오차 손실 함수를 사용합니다.

에포크(epoch)는 확률적 경사 하강법에서 전체 샘플을 모두 사용하는 한번 반복을 의미합니다. 일반적으로 경사 하강법 알고리즘은 수십에서 수백 번의 에포크를 반복합니다.

Chapter 5. 트리 알고리즘

결정트리는 예/아니오에 대한 질문을 이어나가면서 정답을 찾아 학습하는 알고리즘으로 비교적 예측 과정을 이해하기 쉽고 성능도 뛰어납니다.

불순도는 결정트리가 최적의 질문을 찾기 위한 기준으로 사이킷런은 지니 불순도와 엔트로피 불순도를 제공합니다.

정보이득은 부모 노드와 자식 노드의 불순도 차이입니다. 결정 트리 알고리즘은 정보 이득이 최대화되도록 학습합니다.

결정트리는 제한 없이 성장하면 훈련 세트에 과대적합되기 쉽습니다. 가지치기는 결정트리의 성장을 제한하는 방법으로 사이킷런의 결정트리 알고리즘은 여러가지 가지치기 매개변수를 제공합니다.

특성중요도는 결정트리에 사용된 특성이 불소도를 감소하는데 기여한 정도를 나타내는 값으로 특성 중요도를 계산할 수 있는 것이 결정트리의 큰 장점입니다.

검증 세트는 하이퍼파라미터 튜닝을 위해 모델을 평가 할 때, 테스트 세트를 사용하지 않기 위해 훈련 세트에서 다시 떼어 낸 데이터 세트입니다.

교차 검증은 훈련 세트를 여러 폴드로 나눈 다음 한 폴드가 검증 세트의 역할을 하고 나머지 폴드에서는 모델을 훈련합니다. 교차 검증은 이런 식으로 모든 폴드에 대해 검증 점수를 얻어 평균하는 방법입니다.

그리드 서치는 하이퍼파라미터 탐색을 자동화해주는 도구입니다. 탐색할 매개변수를 나열하면 교차 검증을 수행하여 가장 좋은 검증 점수의 매개변수 조합을 선택합니다. 마지막으로 이 매개변수 조합으로 최종 모델을 훈련합니다.

랜덤 서치는 연속된 매개변수 값을 탐색할 때 유용합니다. 탐색할 값을 직접 나열하는 것이 아니고 탐색 값을 샘플링할 수 있는 확률 분포 객체를 전달합니다. 지정된 횟수만큼 샘플링하여 교차 검증을 수행하기 때문에 시스템 자원이 허락하는 만큼 탐색량을 조절할 수 있습니다.

앙상블 학습은 정형 데이터에서 가장 뛰어난 성능을 내는 머신러닝 알고리즘 중 하나입니다.

랜덤포레스트 : 대표 앙상블 학습 알고리즘으로 부트스트랩 샘플을 사용하고 랜덤하게 일부 특성을 선택하여 트리를 만드는 것이 특징입니다.

엑스트라 트리 : 결정 트리의 노드를 랜덤하게 노드를 분할해 과대적합을 감소시킵니다.

그레디언트 부스팅 : 이전 트리의 손실을 보완하는 식으로 얕은 결정 트리를 연속하여 추가하여 손실함수를 최소화하는 앙상블 방법입니다. 훈련 속도가 조금 느리지만 더 좋은 성능을 기대할 수 있습니다.

히스토그램 기반 그레디언트 부스팅 : 훈련 데이터를 256개 정수 구간으로 나누어 빠르고 높은 성능을 매우 인기가 높습니다.

Chapter 6. 비지도 학습

비지도 학습은 머신러닝의 한 종류로 훈련 데이터에 타킷이 없습니다. 타킷이 없기 때문에 외부의 도움없이 스스로 유용한 무언가를 학습해야 합니다. 대표적인 비지도 학습 방법은 군집, 차원 축소 등입니다.

히스토그램은 구간별로 값이 발생한 빈도를 그래프로 표시한 것입니다. 보통 x축이 값의 구간(계급)이고 y축은 발생 빈도(도수)입니다.

군집은 비슷한 샘플끼리 하나의 그룹으로 모으는 대표적인 비지도 학습 작업으로 군집 알고리즘으로 모은 샘플 그룹을 클러스터라고 부릅니다.

k-평균 알고리즘은 처음에 랜덤하게 클러스터 중심을 정하고 클러스터를 만듭니다. 그 다음 클러스터의 중심을 이동하고 다시 클러스터를 만드는 식으로 반복해서 최적의 클러스터를 구성하는 알고리즘입니다.

차원 추고는 원본 데이터의 특성을 적은 수의 새로운 특성으로 변환하는 비지도 학습의 한 종류입니다. 차원 축소는 저장공간을 줄이고 시각화하기 쉽습니다. 또한 다른 알고리즘의 성능을 높일 수 도 있습니다.

주성분 분석(PCA)는 차원 축소 알고리즘의 하나로 데이터에서 가장 분산이 큰 방향을 찾는 방법입니다. 이런 방향을 주성분이라고 부릅니다. 원본 데이터를 주성분에 투영하여 새로운 특성을 만들 수 있습니다. 일반적으로 주성분은 원본 데이터에 있는 특성 개수보다 작습니다.

Chapter 7. 딥러닝을 시작합니다

인공신경망은 생물학적 뉴런에서 영감을 받아 만든 머신러닝 알고리즘이다. 이름이 신경망이지만 실제 우리 뇌를 모델링한 것은 아닙니다. 인공신경만은 다름 이름으로 딥러닝이라고 부릅니다.

텐서플로는 구글이 만든 딥러닝 라이브러리로 매우 인기가 높으며 CPU와 GPU를 사용해 인공 신경망 모델을 효율적으로 훈련하며 모델 구축과 서비스에 필요한 다양한 도구를 제공합니다. 텐서플로2.0부터 신경망 기 모델을

빠르게 구성할 수 있는 케라스를 핵심 API로 채택하여 간단한 모델에서 복잡한 모델까지 손쉽게 만들수 있습니다.

밀집층은 가장 간단한 인공신경망의 층입니다. 인공신경망에는 여러 종류의 층이 있습니다. 밀집층에서는 뉴런들이 모두 연결되어 있기 때문에 완전 연결 층이라고 부릅니다. 특별히 출력층에 밀집층을 사용할 때는

분류하려는 클래스와 동일한 개수의 뉴런을 사용합니다.

원-핫 인코딩은 정수값을 배열에서 해당 정수 위치의 원소만 1이고 나머진 모두 0으로 변환합니다,. 이런 변환이 필요한 이유는 다중 분류에서 출력층에서 만든 확률과 크로스 엔트로피 손실을 계산하기 위해서 입니다.

심층 신경망은 2개 이상의 층을 포함한 신경망입니다. 종종 다층 인공신경망, 심층신경망, 딥러닝을 같은 의미로 사용합니다.

렐루 함수는 이미지 분류 모델의 은닉층에 많이 사용하는 활성화 함수입니다. 시그모이드 함수는 층이 많을수록 활성화 함수의 양쪽 끝에서 변화가 작기 때문에 학습이 어려워집니다. 렐루 함수는 이런 문제가 없으며 계산도 간단합니다.

옵티마이저는 신경망의 가중치와 절편을 학습하기 위한 알고리즘으로 케라스에는 다양한 경사 하강법 알고리즘이 구현되어 있습니다. 대표적으로 SGD, 네스테로포 모멘텀, RMSprop, Adam 등이 있습니다.

드롭아웃은 은닉층에 있는 뉴런의 출력을 랜덤하게 꺼서 과대적합을 막는 기법입니다. 드롭아웃은 훈련 중에 적용되며 평가나 예측에서는 적용하지 않습니다. 텐서플로는 이를 자동으로 처리합니다.

콜백은 케라스 모델을 훈련하는 도중에 어떤 작업을 수행할 수 있도록 도와주는 도구입니다. 대표적으로 최상의 모델을 자동으로 저장해 주거나 검증 점수가 더 이상 향상되지 않으면 일찍 종료할수 있습니다.

조기종료는 검증 점수가 더 이상 감소하지 않고 상승하여 과대적합이 일어나면 훈련을 계속 진행하지 않고 멈추는 기법입니다.

Chapter8. 이미지를 위한 인공 신경망

합성곱은 밀집층과 비슷하게 입력과 가중치를 곱하고 절편을 더하는 선형 계산입니다. 하지만 밀집층과 달리 각 합성곱은 입력 전체가 아니라 일부만 사용하여 선형 계산을 수행합니다.

합성곱 층의 필터는 밀집층의 뉴런에 해당하며 필터의 가중치와 절편을 종종 커널이라고 부릅니다. 자주 사용되는 커널의 크기는 (3,3) 또는 (5,5)입니다. 커널의 깊이는 입력의 깊이와 같습니다.

특성 맵은 합성공 층이나 풀링 층의 출력 배열을 의미합니다. 필터 하나가 하나의 특성 맵을 만듭니다. 합성곱 층에서 5개의 특성 맵이 만들어 집니다.

패딩은 합성곱 층의 입력 주위에 추가한 0으로 채워진 픽셀입니다. 패딩을 사용하지 않는 것을 밸리드 패딩이라고 합니다. 합성곱 층의 출력 크기를 입력과 동일하게 만들기 위해 입력에 패딩을 추가하는 것을 세임 패딩입니다.

스트라이드는 합성곱 층에서 필터가 입력 위를 이동하는 크기입니다. 일반적으로 스크라이드는 1픽셀을 사용합니다.

풀링은 가중치가 없고 특성 맵의 가로세로 크기를 줄이는 역할을 수행합니다. 대표적으로 최대 풀링과 평균 풀링이 있으며 (2,2) 풀링으로 입력을 절반으로 줄입니다.

가중치 시각화는 합성곱 층의 가중치를 이미지로 출력하는 것을 말합니다. 합성곱 신경망는 주로 이미지를 다루기 때문에 가중치가 시각적인 패턴을 학습하는 지 알아볼 수 있습니다.

특성맵 시각화는 합성곱 층의 활성화 출력을 이미지로 그리는 것을 말합니다. 가중치 시각화와 함께 비교하여 각 필터가 이미지 어느 부분을 활성화시키는 지 확인할 수 있습니다.

Chapter 9. 텍스르르 위한 인공 신경망

순차 데이터는 텍스트나 시계열 데이터와 같이 순서에 의미가 있는 데이터입니다. 대표적인 순차 데이터로는 글, 대화, 일자별 날씨 등 예로 들수 있습니다.

순환 신경망은 순차 데이터에 잘 맞는 인공 신경망의 한 종류입니다. 순차 데이터를 처리하기 위해 고안된 순환층을 1개이상 사용한 신경망을 순환 신경망이라고 합니다.

망뭉치는 자연어 처리에서 사용하는 텍스트 데이터의 모음, 즉 훈련데이터셋을 뜻합니다.

토큰은 텍스트에서 공백으로 구분되는 문자열을 말하며, 종종 소문자로 변환하고 구둣점은 삭제합니다.

원-핫 인코딩은 어떤 클래스에 해당하는 원소만 1이고, 나머진 0인 벡터입니다. 정수로 변환된 토큰을 원-핫 인코딩으로 변환하려면 어휘 사전 크기의 벡터가 만들어집니다.

단어 임베딩은 정수로 변환된 토큰을 비교적 작은 크기의 실수 밀집 벡터로 변환합니다. 이런 밀집 벡터는 단어 사이의 관계를 표현할 수 있기 때문에 자연어 처리에서 좋은 성능을 발휘합니다.

LSTM 셀은 타입스텝이 긴 데이터를 효과적으로 학습하기 위해 고안된 순환층입니다. 입력게이트, 삭제게이트, 출력게이트 역할을 하는 작은 셀이 포함되어 있습니다.

LSTM 셀은 은닉상태 외에 셀 상태를 출력합니다. 셀 상태는 다음 층으로 전달되지 않으며 현재 셀에서만 순환됩니다.

GRU 셀은 LSTM 셀의 간소화 버전으로 LSTM 셀 못지 않은 성능을 냅니다

총평

혼자서 머신러닝와 딥러닝을 공부하는 것은 생각보다 쉽지 않습니다. 그래서 이 책을 통해 기본기를 다지고 싶다면 충분히 가능할 거 같습니다. 책 내용안에는 다양한 예제와 예시가 있어 공부하는게 무엇보다 쉽게 진행할 수 있습니다. 무엇보다도 머신러닝과 딥러닝을 실습을 위해선 장비 스펙이 중요한데 여기에서는 구글 코랩을 활용하여 실습을 진행이 가능하기 때문입니다.

아무쪼록 머신러닝과 딥러닝 입문서로 최적화 되어 있으니 혼자서도 공부가 가능할거라 생각됩니다. 많은 서적에서 전문적인 예시와 수식을 활용해서 가이드를 해주지만 전공자가 아니라면 이해하기 어렵고 금방 쉽게 지쳐서 포기하게 될것입니다. 마지막으로 혼공 용어노트가 별첨으로 있으니 용어가 어려울시 참고하시면 도움이 됩니다.

참고사이트

저자 블로그 : https://tensorflow.blog
케라스 공식문서 : https://keras-ko.kr

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

vita1***l2023-04-23

기초개념부터 실무활용까지 인공지능을 공부하고 싶다면!!

- 간략하지만 전반적인 흐름을 이해하기 쉽도록 요약된 설명
- 인공지능, 텐서플로 등 다양한 개념들에 대해 설명이 되어 있다. 길지 않기에 읽는데에 전혀 부담이 없고 전체적인 흐름을 이해하기에 적합해서 좋았다.
- 예시를 기반으로 한 자세한 설명
- 구체적인 예시와 그에 따라 필요한 조건과 결과에 대해 자세히 설명되어 있다. 많은 개념들, 패키지, 함수가 등장할 수 밖에 없는 주제에 대해 그러한 것들을 사용하는 목적과 결과에 대해 아주 상세하게 알려주어서 큰 도움이 되었다.
- 구체적인 학습 로드맵 제시
- 처음부터 마지막까지 모든 단원을 읽다 보면 어느 단원은 이해가 잘 안되었는데 이게 그 다음에 영향을 주는 것이 아닌가에 대해 염려했던 적이 있다. 이 책에서는 특정 단원에서 어떠한 것을 제시하니 이것에 관심이 있을 경우 건너뛰어도 될 부분과 꼭 숙지하면 좋을 단원과 개념에 대해서도 책의 초반부에서 자세히 알려주어 주었다.
- 파이썬 문법의 설명
- 51쪽에서처럼 책 내부에서 사용되는 파이썬의 문법에 대해서는 간략하게 설명이 되어 있다. 책의 내용을 이해하기에 충분할 정도여서 책을 보다가 모르는 부분이 나와도 굳이 따로 찾아보지 않아도 되어 좋았다. 파이썬 개념 외에도 ‘여기서 잠깐’ 코너에서는 다양한 개념에 대해 부가적으로 알려준다.
- 다양한 자료에 대해 쉽게 입력할 수 있도록 bit.ly 주소 제공
- 코딩을 하다가 syntax error가 발생하는 것처럼 입력하는 데이터의 값이 조금만 달라져도 결과값이 다르거나 에러가 발생한다. 이러한 과정의 디버깅을 위해 필요한 시간은 책에서 전달하는 개념의 이해와 별개의 시간이기도 하다. 그래서 이 책에서는 이러한 상황을 미연에 방지하고자 미리 다양한 데이터에 대해 준비되어 있고, 그 주소를 바로 가져와서 사용하면 되어서 정말 편리했다.
- 한 단원에서 다룬 전체 코드에 대해 정리
- 한 단원에서 다룬 전체 소스 코드에 대해 주석과 함께 정리되어 있다. 이 역시 bit.ly 주소가 제공되어 있는데 학습한 내용을 한 두페이지 이내에서 매 단원마다 볼 수 있어서 좋았다.
- 자세한 그림
- 특정 상황에서 특정 구조는 어떻게 되어 있다고 자세한 그림으로 알려준다. 텍스트로만 보는 것보다 그것을 그림으로 풀어냈을 때 이해하기에 훨씬 쉬운데 이 역시 구체적인 자료로 전달되어서 이해에 많은 도움이 되었다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다

zer***l2023-04-20

머신 러닝 입문서로써 추천할 만한 책!!

머신러닝과 딥러닝에 대해 처음 접하시는 분들께서 입문서로 보실 수 있는 책이다. 어려운 수학적 지식이나 복잡한 알고리즘에 대한 이해가 없더라도 파이썬에 대한 기본 지식 정도만 있다면 책에 나오는 코드를 쉽게 이해하고 따라 할 수 있었다. 매 단위마다 별개의 예제가 등장하지 않고, 처음에 등장하는 생선 분류 처리 예제가 책 전체에 걸쳐 사용된다. 이 생선 분류 처리 예제가 책 전체를 관통하며, Chapter별 주제들이 결합며 머신러닝과 딥러닝에 대한 주요 내용들에 대한 설명과 이해를 도와 준다. 또한, 실습을 위해 복잡하게 컴퓨터에 별도 Tool을 설치 할 필요가 없이, 인터넷만 연결된다면 구글 코랩(Colab)을 통해서 무료로 쉽게 코드를 작성하고 실행, 결과까지 확인 할 수 있었다. 구글 코랩 주소 : https://colab.research.google.com/?hl=ko 책 내용은 크게 머신러닝편(1 ~ 6장)과 딥러닝편(7 ~ 9장)으로 나눌 수 있다. 순차적으로 내용을 공부해 나가도 되며, 딥러닝을 먼서 배우고 싶다면 1 ~ 4장을 통해 기초지식을 접한 후 7장으로 넘어가면 된다. 특히나 책에서도 강조 하지만, 7장으로 넘어가기전, 4장 다양한분류 알고리즘 내용은 조금 더 세밀하게 봐야 한다. (1 ~ 4장을 접한 후 7장으로 넘어가서 봤는데, 순차적으로 읽어 보면서 차근차근 나아가는 것도 괜찮은 방법으로 느껴졌다.) 혼자 공부하는 머신러닝 + 딥러닝 이 책은 이 머신러닝과 딥러닝에 대한 재미와 흥미를 갖게 하는 입문서와 다음 단계로 갈 수 있는 디딤돌 역할을 할 수 있는 책으로 충분한 책인 것 같다 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

gofum***l2023-04-16

혼자공부하는 머신러닝+딥러닝

kianms10***l2023-04-16

입문자에게 강력추천! [혼자 공부하는 머신러닝+딥러닝]

moo***l2023-04-16

쉽게 따라 할 수 있는 예시와 혼공머신의 스토리가 끌리는 머신러닝 입문서

혼공머신러닝딥러닝.jpg

"혼자 공부하는 머신러닝+딥러닝"은 머신러닝과 딥러닝을 처음 접하는 초보자를 위한 인공지능 자습서입니다. 이 책은 초보자도 쉽게 따라 할 수 있는 구성과 풍부한 예제로 이루어져 있어 머신러닝과 딥러닝을 처음 접하는 독자들에게 유용한 책입니다.

이 책은 스토리 형식으로 구성되어 있어 독자들이 흥미를 느끼면서 학습할 수 있도록 합니다. 이 책의 주인공인 "혼공머신"은 머신러닝과 딥러닝에 대한 이해도가 높지 않은 상황에서 이를 학습하면서 성장하는 과정을 보여줍니다. 이를 통해 쉽게 따라 할 수 있는 실습 예제와 함께 머신러닝과 딥러닝의 기초 개념부터 실제 모델링 및 학습, 평가까지 전반적인 과정을 체계적으로 학습할 수 있어서 즐거웠습니다.

이 책은 역시나 인공지능을 다루기 위한 대표적인 언어인 파이썬을 이용한 코드로 머신러닝 및 딥러닝을 다루고 있어서 쉽게 따라 할 수 있습니다. 최근에는 GPT-3, BERT, GAN, GPT-4 등과 같은 기술들이 대두되고 있는데, 이러한 최신 기술은 다루지 않습니다. 다음 버전의 책에서는 관련 내용도 볼 수 있길 기대해 봅니다. 또한 인공지능이 수학적인 이론에 바탕을 둔 만큼 수학적인 이해가 부족한 경우에는 함축적이고 추상적으로 설명한 책의 내용을 이해하기가 어려울지도 모르겠습니다. 하지만 초보자를 위한 책이기 때문에 복잡한 수학적 설명이 적은 것이 더 좋을지도 모르겠다는 생각도 듭니다.

책이 스토리 형식으로 구성되어 있어서 흥미를 느끼면서 학습할 수 있다는 점과 각 장마다 목차가 세세하게 구성되어 있어 쉽게 원하는 내용을 찾을 수 있다는 점에서 구성이 직관적입니다. 머신러닝과 딥러닝의 기초 개념부터 전체적인 프로세스를 다루고 있어, 처음 접하는 초보자에게는 딱 들어맞는 책입니다. 이 책을 보충하는 온라인 강의도 제공되기 때문에 그 장점이 더 강화된다고 생각합니다.

진입 장벽이 높게만 느껴졌던 머신러닝과 딥러닝에 대해서 친근하고 편하게 다가갈 수 있는 멋진 책이었습니다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

jjk2***l2023-04-08

\"혼자공부하는 머신러닝과 딥러닝\"을 읽고난 소감

dhan***l2022-08-22

머신러닝 완벽 입문서

ybh***l2021-08-30

어려운 머신러닝을 쉽게 공부할 수 있는 책

"혼자 공부하는 머신러닝 + 딥러닝" 책을 년 초에 구입하고 읽지 못하고 있다가 이번에 혼공학습단 6기가 있어서 신청하고 읽어보고 머신러닝을 학습하게 되었다.

머신러닝, 덥러닝은 우선 학습하기가 어려운것 같다. 어려운 개념과 그리고 수학공식등 학습하기에 어려운 분야라고 생각한다.

정말 수학공식은 참 어려운것 같다.

우선 "혼자 공부하는 머신러닝 + 딥러닝"도 쉽지는 않다고 생각한다. 그러나 다른 책과는 다르게 각 단원의 예제와 그리고 해결 방법 접근방식은 현실적이고 그리고 반복적인 학습을 통해 쉽게 읽혀지는 책이라고 생각한다. ( Youtube 강의의 "지난시간에")

그리고 해당 책과 youtube 강의와 같이 학습을 해보니 그래도 쉽게 학습을 할 수 있었던것 같다.

마지막까지 해당책을 읽게 된 거는 혼공학습단도 큰 기여를 한것 같다. 1주에 1 Chapter~2 Chapter 씩 자기주도학습 범위가 있으니 어떻게든 책과 youtube 영상을 보면서 학습을 할 수 있었고 해당 방법을 통해 쉽지않은 분야의 책을 읽게 된거는 좋은 경험이었던것 같다.

이 책의 장점은
1. 학습 로드맵 : 학습 로드맵을 통해 전체적인 학습 방향 및 내용을 확인가능
2. 쉬운 예제 : 회사 업무와 같은 접근방식 과 해결방법을 도출
3. 마무리, 확인문제 : 최종 학습내용 , 주제정리 가능
4. youtube 강의 : 반복학습, 중요점 체크가능
5. 혼공단(혼공학습단) : 학습동기 부여

이라고 생각한다. 해당 장점은 다른 책에서는 없는 면인데 이런 장점으로 인해 "혼자 공부하는 머신러닝 + 딥러닝" 책 한권을 마지막까지 읽게 된것이라고 생각한다.

다른 사람도 공부하기 어렵다면 youtube 강의와 혼공학습단을 통해 책을 읽어보면서 공부를 하기를 추천해본다. 다른사람을 통해 자극도 되고 마지막까지 읽을수 있는 자극이 된다고 생각한다.

머신러닝 학습하기에 어렵다면 우선 이 책 "혼자 공부하는 머신러닝+ 딥러닝" 을 추천해 본다.

cona***l2021-01-09

역시 혼자 공부하기 좋은 입문서

입문자용 시리즈로 최근 각광을 받고 있는 혼공자 시리즈에서 드디어 머신러닝+딥러닝 부문이 출간되었다.

혼자 공부하는 책이니 만큼 어려운 수식도 없고 실습 위주로 어렵기만 하게 느껴지던 머신러닝과 딥러닝에 발을 들일 수 있도록 해준다.

기본 개념들은 실습을 통해서 어떤 것인지 감을 잡히도록 구성하고 있다. 원론적인 수식도 중요한 부분이지만 그것이 입문 허들을 높이는 것 또한 사실이다. 그러나 일단 뛰어들 수 있도록 하는것이 중요하다. 그러면 여러 가지들을 하나씩 생성해서 결국 나무가 되기 때문이다.

이 책은 그런 면에서 좋은 입문서이다. 프로그래밍 언어를 배울 때도 고레벨의 언어 사용법부터 배우지 그 언어가 바이트코드로 만들어지고 또 그 바이트코드가 어떤게 동작하고 컴퓨터구조는 이렇고 저렇고 이런걸 다 배우지 않는 것처럼... 다 알면 더 좋은 프로그래머가 될 수 있지만 시작부터 그럴수는 없는 법이다.

이렇게 기본 내용에 대해 확인할 수 있는 문제도 있다. 이렇게 문제가 있어야 좀 더 긴장(?)을 하게 되고 무심코 넘어갔던 내용에 대해 다시 한 번 상기하고 집중하는 과정을 거칠 수 있다. 모든 공부의 시작은 사실 암기라고 생각하기 때문에 이런 부분도 마음에 들었다.

풀코드도 이렇게 존재한다. 이게 어렵다고 느껴지는 사람도 있을 수 있겠지만 이건 정말 필수기 때문에 파이썬의 기본은 알아야 한다.

부록으로 별도의 용어집을 제공한다. 어떤 도메인에 뛰어들 때 용어는 매우 중요하다. 이게 암기가 필요한 이유기도 하다. 잘 정리된 용어집은 초보자들에게 매우 유용하다고 생각한다.

실제 예제 중심으로 머신러닝에 입문해보고자 하는 파이썬을 조금 아는 사람들은 이 책으로 입문하기에 좋다!

u***l2021-01-07

혼자서 공부하기 좋은 시기에 딱 공부하기 좋은 책

pcr3***l2021-01-04

혼자 공부하기 정말 좋은 머신러닝 독학책

해당 포스트는 한빛미디어에서 서적을 제공받아 작성했습니다.

혼자 공부하는 머신러닝 + 딥러닝 표지

이번 한빛 리뷰단 서적은

혼자 공부하는 머신러닝+딥러닝

이 당첨되었어요

머신러닝 분야는 예에에에에전에

나중에는 관련 전문가들과 협업하는게

일상이 될지도 모른다는 생각에

혼자서 독파하려고 노력해본 적이 있어요

ㅎㅎㅎ

아무래도 선수학습이 필요한 강의를 들어버린지라

용어부터 생소해서 얼마안가 포기했었어요

이번에는 어떨지...

기대반 걱정반으로 책을 펴 보았습니다

chapter1 에서는 머신러닝이란 무엇인지에 대한 간단한 설명과

다루기위한 툴, 간단한 설명을

chapter2 에서는 데이터 분류와 전처리

chapter3 에서는 회귀 알고리즘을

chapter4 에서는 분류 알고리즘

chapter5 에서는 트리 알고리즘

chapter6 비지도 학습을

chapter7 에서는 딥러닝의 신경망에 대한 내용을 설명하고

chapter8 은 합성곱 신경망을 이용한 이미지 분류

chapter9 에서는 순환 신경망을 이용해 텍스트 분류를 설명하고 있습니다.

단원마다 내용설명 후 전체 코딩과 핵심 키워드를 짚어주고 핵심을 되짚을 수 있는 문제로 리마인딩을 시켜줘

내용을 이해하는 데 도움이 많이 되었습니다.

무엇보다 어렵게 생각할 수 있는 머신러닝을

예시와 간단한 코딩을 잘 곁들여 이해를 쉽게 해줘 도움이 되었습니다.

그리고 추가로 (2021년 1월 4일) 현재 유튜브로

추가 강의를 진행 중이어서 듣고 보면서 하니 더 잘 보게되는 것 같습니다.

이 책과 코랩, 유튜브 강의를 잘 조합하면 빠른 시간에 머신러닝 기초를 쌓는 데 도움이 되어

정말 추천하고 싶네요 ㅎㅎ

jjk8***l2021-01-04

저자직강을 통하여 혼자 공부하는 머신러닝+딥러닝

ksse***l2021-01-03

비전공자도 공부하기 쉬운 혼공머신 도서

mwle***l2021-01-01

(리뷰) 혼자 공부하는 머신러닝 + 딥러닝

8delp***l2020-12-28

입문자를 위한 머신러닝+딥러닝 교과서

인공지능, 딥러닝 분야에서 아주 좋은 책이 나왔다. 한빛미디어 출판사의 '혼자 공부하는' 시리즈 중 가장 최근에 출간된 '혼자 공부하는 머신러닝+딥러닝'이라는 책이다. '혼자 공부하는' 시리즈는 예전에 '혼자 공부하는 자바'란 책으로 공부해본 바 있어 매우 익숙하다. 책 제목처럼 정말 혼자 공부할 수 있도록, 즉 독학도 가능하도록 구성한 책이다.

요즘 초보자나 입문자를 위해서 인공지능, 딥러닝 관련 학습서들이 많이 시장에 많이 나오고 있는데 이 책은 그런 분류의 독자들을 타겟으로 하는 책 중 가장 내용과 설명이 쉽고 인공지능과 관련하여 상대적으로 폭 넓은 부분을 다루고 있다. 그렇다보니 나는 개인적으로 이 책을 읽으면서 한번 읽더라도 책을 다른 곳에 내버려두지 말고 틈날때 마다 보라고 권하고 싶다. 언제? 이제 입문 수준에서 조금 나아갔는데 다른 책에서 용어나 설명이 어려워서 이해가 안갈 때 말이다. 마치 참고서처럼 어딘가 막히는 곳에서 가이드가 되어줄 책이다.

한빛미디어의 책들이 과하지 않은 적정한 수준의 컬러판으로 나오고 있어서 흑백판의 학습서에 질려버린 분들에게는 추천할 만하다. 그리고 그냥 단순히 개념을 소개하고 코딩을 따라하는 것이 아니라 학습자가 흥미를 잃지 않도록 '한빛 마트'라는 가상의 가게에서 일어나는 일들을 인공지능으로 구현해본다는 재미있는 시나리오로 책이 진행된다.

딥러닝에서 걱정되는 부분 중 하나는 모델을 돌릴 때 GPU와 같은 하드웨어가 굉장히 중요하다고 하는데 그런 정도의 고성능의 컴퓨터가 없어서 제대로 실습을 할 수 있을까 하는 부분이다. 걱정마시라. 이를 위해 구글의 코랩이라는 플랫폼으로 가상의 자원을 빌려 코딩을 수행해볼 수 있다. 책 극초반부에 잘 소개를 하고 있으니 입문자분들도 금방 익숙해질 것이라고 생각한다.

당연한 것이지만 이 책은 학교에서 공부하듯 읽는 책이 아니다. 직접 구현해보기 위해 책에 나온 코드 부분을 직접 실습해보아야 한다. 해당 코드를 복사해서 바로 돌려볼 수 있는 곳도 저자가 안내하고 있으니 너무 코드가 길 때는 이해만 하고 넘어가고 복사된 코드를 붙여넣어 신경망, 딥러닝 모델을 돌려볼 수 있다.

책을 읽다보니 저자가 쉽게 설명하기 위해 정말 심혈을 기울였다는 느낌이 들었다. 나도 다른 인공지능 서적을 공부할 때 넘기는 한쪽 한쪽이 너무나 어려운 과제였다. 이 책을 만나는 분들은 그러한 어려움을 도와주고 보충해줄 수 있는 도서가 나타났으니 큰 도움이 될 것이라 생각한다.

대학에서 데이터마이닝 수업을 들을 때 내가 잘 이해가 가지 않는 용어에 대해 교수님께 물어본 기억이 있다. 교수님은 그냥 대충 얼버무리며 넘어가려고 하셨다. 좀 많이 실망스러웠다. 그러나 그때 궁금했던 것을 이 책을 통해 많이 해소할 수 있었다.

'한빛 마트'라는 가상의 마트가 있다는 재미있는 시나리오로 인공지능 문제를 풀어나간다.

어려울 수 있는 용어는 매 장 끝마다 정리할 수 있도록 도와주고 있다.

위에서 언급한 바와 같이 생선 종류를 분류한다는 이야기로 인공지능 문제를 해결하는 것이다.

인공지능을 공부하는데에 어려운 점이 뭐가 있을까? 수학? 수학도 파고 들면 무척 어렵다. 그리고 단기간에 쉽게 해결할 수 있는 부분이 아니기도 하다. 그렇다고 공부는 안할 수 없다. 그 다음으로 어려운 것은 바로 인공지능, 딥러닝, 그리고 고급 통계와 관련된 '전문 용어'가 아닐까 싶다. 그냥 듣기만 해도 어렵다는 느낌이 팍팍 올 수 있다. 그래서 조금 놀랐던게 본 책에서는 책 마지막 장에 부록 형식으로 용어 사전(혼공 노트)을 제공해준다!

특별히 기억하기 어려웠던 용어가 있다면 언제 어디서든 복습할 수 있도록 용어를 요약한 노트가 있다는게 무척 마음에 들었다.

한빛미디어 유튜브 채널에 가면 저자가 최근에 올린 영상들이 있다. 그래도 잘 이해가 안가고 설명이 듣고 싶다면 한빛미디어 유튜브 채널에 올라온 혼자 공부하는 머신러닝+딥러닝 강의를 들으면 큰 도움이 될 것 같다. 책을 사면 매우 높은 퀄리티의 강의까지 제공하니 얼마나 가성비 높은 학습서인가!

jjjun***l2020-12-28

혼자 공부하는 머신러닝 + 딥러닝

ars***l2020-12-24

[리뷰] 혼자 공부하는 머신러닝+딥러닝

todayon***l2020-12-20

혼자 공부하는 머신러닝+딥러닝, 박해선

rona***l2020-12-20

'야 나두' 머신러닝+딥러닝 코딩할 수 있다

<혼자 공부하는 머신러닝+딥러닝>, 박해선 지음, 한빛미디어, 2020

기업에서 중장기 변화를 예측할 때 보통 연평균 성장률(compoundannual growth rate, CAGR)을 사용한다. 최근 3개년이나 5개년 연평균 성장률을 적용해 앞으로의 실적을 예측한다. 주어진 데이터의 한계로 이를 사용할 수밖에 없겠지만, 대체로 연평균성장률을적용한 미래예측은 잘 맞지 않는다.

최근 정보통신 기술의 발달로 인해 빅데이터, 인공지능이 빠르게일상에 접목되고 있어, 혹시라도 기업의 중장기 변화를 예측하는 데 있어 머신러닝, 딥러닝을 접목할 수 있지 않을까 싶었다. 프로그래밍에 대해서는 아는바가 없어 실제 구현 가능한지 감이 잡히지 않았다.

머신러닝, 딥러닝 프로그램에 대한 용어나 원리 등이라도 이해해볼요량으로 책을 찾았지만, 함수와 코드 위주로 설명된 책들은 C언어를알지 못하면 이해하기 쉽지 않았다. <혼자 공부하는 머신러닝+딥러닝>은 ‘인공지능 공부가 정말 처음일 때, 어려운 수식에 지쳤을 때, 쉬운 그림과 실전 예제로 공부하고 싶을때’라는 표지의 문구가 끌렸다. 이번엔 이해할 수 있을 것이란‘근거 없는 자신감’이 생겼다.

쉽게 이해할 수 있는 예제와 비유를 사용했습니다.
심지어 이 분야와 무관하더라도 파이썬만 알고 있다면
머신러닝과 딥러닝을 학습할 수 있도록 꾸몄습니다.(6쪽)

<혼공머신>은파이썬, 사이킷런 등 라이브러리를 설치하지 않고 네트워크에 연결된 컴퓨터와 ‘구글 코렙’을 통해 실습하도록 안내하고 있다. 구글 코렙에서 작성한 ‘노트북’은구글 드라이브에도 저장이 되니, 인터넷만 연결되면 보유 컴퓨터의 성능과 상관 없이 머신러닝, 딥러닝 프로그램 개발이 가능하다.

머신러닝과 딥러닝 관련 용어들과 작동 원리를 설명하고, 직접프로그래밍 실습을 할 수 있도록 구성되어 있어, 비교적 쉽게 이해할 수 있다. 생선 가게에서 도미를 분류하는 단순한 방법으로 출발해, 주어진 길이정보로 무게를 예측하고, 내용물을 알 수 없는 럭키백의 확률을 계산하는 복잡한 방법까지 프로그래밍할수 있도록 알고리즘과 함수들을 세세히 짚어준다.

머신러닝은 K-최근접 이웃 회귀와 선형 회귀 등 회귀 알고리즘과로지스틱 회귀, 확률적 경사 하강법 등 분류 알고리즘은 물론, 트리알고리즘과 군집 알고리즘의 순서로 단계를 높여 간다. 그리고 딥러닝은 이미지와 텍스트를 위한 인공 신경망으로구분해 개념을 설명하고 실습할 수 있도록 하고 있다.

키보드에 손을 올려놓고 책의 코드를 직접 입력하면서 읽는 책입니다.(…)
귀찮다거나 어렵다고 생각해 미루지 마세요.
컴퓨터 앞에서 실습하면서 공부하면
어느새 글자로는 쉽게 이해할 수 없었던 개념을
너무나 당연하게 몸으로 느낄 수 있을 것입니다.(7쪽)

불과 몇 년 전만 해도 머신러닝, 딥러닝 프로그래밍을 하려면C언어를 다룰 줄 알아야 한다고 했었다. 머신러닝, 딥러닝을 위한 서버를 구축하거나 복잡한 머신러닝 구동을 위해 컴퓨터 성능도 좋아야 했다. 지금은 인터넷만 연결된다면 하드웨어의 제약 없이 구글의 자원을 이용해 누구나 쉽게 머신러닝, 딥러닝 프로그래밍이 가능하게 되었으니 세상은 내가 생각하는 것보다 훨씬 빠르게, 편하게 편하고 있는 것 같다.

여전히 기업의 중장기 변화 예측에 대한 솔루션을 찾은 것은 아니지만 다양한 기업 정보가 담긴 빅데이터를확보할 수 있다면 불가능하지 않을 것 같다.

* 해당 도서는 출판사로부터 무상으로 제공받았으며, 제 주관에 따라 솔직하게 작성했습니다.

zzo***l2020-12-20

머신러닝 딥러닝 분야의 책을 누구에게든 한권만 추천한다면 이 책을 추천할것 같습니다.

신러닝이나 딥러닝을 보통 배우거나 이해하기 어려운 분야이다. 하지만 이렇게 배우기 어려운 분야도 어떤 예제와 설명이냐에 따라 내용이 쉽게 와 닿기도 한다. 그동안 봤던 책이 너무 어려웠다면 이 책으로 그간의 어려움을 해소할 수 있지 않을까 싶다.

게다가 저자 분은 유명 머신러닝, 딥러닝 책을 여러 권 번역과 출판하신 분이다. 우리집에도 저자 분의 머신러닝, 딥러닝 책이 몇 권이 있을 정도로 이 분야에서 연구나 일을하는 사람이라면 저자 분의 책이 몇 권씩 있을거 같다. 그만큼 믿고 볼 수 있는 저자 분의 책이기도 하다.

그래서 이 책은 초보자를 위한 책이기도 하지만 이미 머신러닝이나 딥러닝 코드를 돌려봤지만 아직도 뭔가 부족하다고 느껴지는 사람들에게 전체적인 내용을 정리해 볼 수 있는 책이기도 하다.