본문내용 바로가기

KYOBO 교보문고

우승팀맞추고상금받기
2020다이어리
  • 손글씨스타 3회차
  • 교보손글쓰기대회 전시페이지
  • 교보인문학석강 2강 장동선 박사
  • 신동엽문학기행
  • 북모닝책강
피처 엔지니어링, 제대로 시작하기
* 중고장터 판매상품은 판매자가 직접 등록/판매하는 상품으로 판매자가 해당상품과 내용에 모든 책임을 집니다. 우측의 제품상태와 하단의 상품상세를 꼭 확인하신 후 구입해주시기 바랍니다.
280쪽 | | 187*236*24mm
ISBN-10 : 1161752420
ISBN-13 : 9791161752426
피처 엔지니어링, 제대로 시작하기 중고
저자 앨리스 젱 | 역자 김우현 | 출판사 에이콘출판
정가
25,000원 신간
판매가
22,500원 [10%↓, 2,500원 할인]
배송비
2,500원 (판매자 직접배송)
지금 주문하시면 2일 이내 출고 가능합니다.
더보기
2019년 1월 2일 출간
제품상태
상태 최상 외형 최상 내형 최상
이 상품 최저가
19,990원 다른가격더보기
새 상품
22,500원 [10%↓, 2,500원 할인] 새상품 바로가기
수량추가 수량빼기
안내 :

중고장터에 등록된 판매 상품과 제품의 상태는 개별 오픈마켓 판매자들이 등록, 판매하는 것으로 중개 시스템만을 제공하는
인터넷 교보문고에서는 해당 상품과 내용에 대해 일체 책임을 지지 않습니다.

교보문고 결제시스템을 이용하지 않은 직거래로 인한 피해 발생시, 교보문고는 일체의 책임을 지지 않습니다.

판매자 상품 소개

※ 해당 상품은 교보문고에서 제공하는 정보를 활용하여 안내하는 상품으로제품 상태를 반드시 확인하신 후 구입하여주시기 바랍니다.

판매자 배송 정책

  • 모든 교환/반품/환불 접수는 판매자와 협의 후 접수를 해주셔야 하며 반품 접수 없이 임의로 반송하거나 우편으로 보낼 경우 환불이 불가할수 있습니다 제품 수령후 7일 이내에 교환이 가능합니다 고객의 단순변심으로 인한 반품/교환/환불 경우 왕복배송비 5.400원 발생

더보기

구매후기 목록
NO 구매후기 구매만족도 ID 등록일
52 이쁜 새책같은 중고도서 잘 받았습니다. 감사합니다. 5점 만점에 5점 wof*** 2019.10.16
51 아주 만족합니다...... 5점 만점에 5점 mukga2*** 2019.10.12
50 잘 받았습니다. 감사합니다. 5점 만점에 5점 hero*** 2019.10.06
49 배송 무사히 잘 왔습니다 5점 만점에 5점 jkh*** 2019.09.10
48 책 상태가 아주 좋습니다. 새책 같습니다. 고맙습니다. 5점 만점에 5점 si*** 2019.09.03

이 책의 시리즈

책 소개

상품구성 목록
상품구성 목록

2019년 대한민국학술원 우수학술도서 선정도서

머신 러닝의 결과는 데이터를 얼마나 잘 표현하는 피처를 추출하는가에 달려있다고 할 수 있다. 그러나 머신 러닝을 위한 다양한 알고리즘이나 도구에 대한 안내서는 많이 있는 것에 비해서 데이터의 피처를 어떻게 추출하고 사용할 도구에 맞게 변환하고 처리할 것인지 알려주는 안내서는 거의 없다. 이 책은 수치형 데이터, 범주형(카테고리) 데이터를 다루는 기법뿐만 아니라 텍스트, 이미지, 그리고 고차원 데이터에서 머신 러닝을 위해 좋은 피처를 추출하는 기법과 그 원리를 설명하고 실습을 통해 직관을 얻을 수 있도록 해준다.

저자소개

저자 : 앨리스 젱
머신 러닝, 알고리즘, 플랫폼 개발 분야의 테크니컬 리더다. 현재 아마존 애드버타이징(Amazon Advertising) 사의 리서치 사이언스 매니저로 근무하고 있다. 그전에는 GraphLab/Dato/Turi에서 툴킷 개발 및 사용자 교육을 담당했고, 마이크로소프트 리서치(Microsoft Research) 사에서 머신 러닝 연구원으로 일했다. UC 버클리(Berkeley)에서 전기공학 및 컴퓨터과학으로 박사(PhD) 학위를, 컴퓨터과학 및 수학으로 학사(BA) 학위를 받았다.

저자 : 아만다 카사리
기술의 다음 지평을 탐구하고 그것이 가져올 영향을 가장 잘 보여줄 수 있는 리더이자 엔지니어다. 현재 Concur Labs의 수석 프로덕트 매니저 겸 데이터 과학자며 SAP Concur의 Concur Labs AI Research 팀의 공동 창립자다. 지난 16년 동안 데이터 과학, 머신 러닝, 복잡계 시스템, 로보틱스 등의 다양한 분야에서 핵심적인 역할을 수행했다. 미국 해군 사관학교(US Naval Academy)에서 제어 시스템 엔지니어링으로 학사(BS) 학위를, 버몬트 대학교(University of Vermont)에서 전기공학으로 석사(MS) 학위를 받았다.

역자 : 김우현
대학생 시절 선배와 함께 창업한 후 20년 가까이 소프트웨어 개발자로 살아오다가 인공지능 분야에서 인생 후반기를 위한 새로운 길을 만들어가고 있다. 국민대학교 경영대학원에서 빅데이터 MBA 과정을 졸업하고, 현재 숙명여자대학교 나노/바이오 전산화학 연구센터에서 데이터 과학자로 일하고 있다. 옮긴 책으로는 『R 데이터 구조와 알고리즘』(에이콘, 2017), 『자바 데이터 사이언스 쿡북』(에이콘, 2018)이 있다.

목차

1장. 머신 러닝 파이프라인
__데이터
__과제
__모델
__피처
__모델 평가

2장. 숫자를 위한 멋진 트릭
__스칼라, 벡터, 공간
__카운트 처리
____바이너리 변환
____양자화 또는 비닝
__로그 변환
____로그 변환의 역할
____거듭제곱 변환: 로그 변환의 일반화
__피처 스케일링 또는 정규화
____min-max 스케일링
____표준화(분산 스케일링)
____ℓ2 정규화
__상호작용 피처
__피처 선택
__요약
__참고 문헌

3장. 텍스트 데이터: 플래트닝, 필터링, 청킹
__bag-of-x: 자연어 텍스트를 평면 벡터로 변환
____BoW
____bag-of-n-grams
__정제된 피처를 위한 필터링
____불용어
____빈도 기반 필터링
____어간 추출
__의미의 단위: n-grams에서 구문까지
____파싱과 토큰화
____구문 탐색을 위한 연어 추출
__요약
__참고 문헌

4장. 피처 스케일링의 효과: BoW에서 tf-idf로
__tf-idf: BoW 비틀기
__tf-idf 테스트
____분류 데이터셋 생성
____tf-idf 변환으로 BoW를 스케일링
____로지스틱 회귀를 이용한 분류
____일반화로 로지스틱 회귀 튜닝
__심층 분석: 무슨 일이 일어나고 있는가?
__요약
__참고 문헌

5장. 범주형 변수: 로봇닭 시대에 달걀 개수 세기
__범주형 변수 인코딩
____원-핫 인코딩
____더미 코딩
____이펙트 코딩
____범주형 변수 인코딩의 장단점
__대규모 범주형 변수 처리
____피처 해싱
____빈 카운팅
__요약
__참고 문헌


6장. 차원 축소: PCA로 데이터 팬케이크 납작하게 만들기
__직관
__수식 유도
____선형 투영법
____분산과 경험적 분산
____주성분: 첫 번째 식
____주성분: 행렬-벡터식
____주성분의 일반적인 해
____피처 변환
____PCA 구현
__PCA의 활약
__화이트닝과 ZCA
__PCA의 고려 사항과 한계
__사용 예
__요약
__참고 문헌

7장. k-means 모델 스태킹을 통한 비선형 피처 생성
__k-means 클러스터링
__곡면 분할로서의 클러스터링
__분류를 위한 k-means 피처 생성
____조밀한 피처 생성
__장단점과 몇 가지 사항들
__요약
__참고 문헌

8장. 피처 생성 자동화: 이미지 피처 추출과 딥러닝
__가장 단순한 이미지 피처(그리고 이것이 동작하지 않는 이유)
__수동 피처 추출: SIFT와 HOG
____이미지 그래디언트
____그래디언트 오리엔테이션 히스토그램
____SIFT 아키텍처
__심층 신경망으로 이미지 피처 학습
____완전 연결 계층
____컨볼루션 계층
____ReLU 변환
____응답 정규화 계층
____풀링 계층
____AlexNet의 구조
__요약
__참고 문헌

9장. 다시 피처로: 학술 논문 추천 시스템 구축
__항목 기반 협업 필터링
__첫 번째 단계: 데이터 가져오기, 정제하기, 피처 파싱하기
____학술 논문 추천 시스템: 단순 접근법
__두 번째 단계: 피처 엔지니어링과 더 똑똑한 모델
____학술 논문 추천 시스템: 테이크 2
__세 번째 단계: 추가 피처 = 추가 정보
____학술 논문 추천 시스템: 테이크 3
__요약
__참고 문헌

부록 A. 선형 모델링과 선형대수 기초
__선형 분류 개관
__행렬 분석
____벡터에서 부분공간으로
____특이값 분해
____데이터 행렬의 기본적인 네 가지 부분공간
__선형 시스템 풀이
__참고 문헌

책 속으로

출판사 서평

★ 이 책에서 다루는 내용 ★ ■ 숫자 데이터에 대한 피처 엔지니어링: 필터링, 비닝, 스케일링, 로그 변환, 거듭제곱 변환 ■ 텍스트 처리 기법: BoW(Bag-of-Words), n-gram, 구문 탐색 ■ 정보가 없는 피처를 제거하기 위...

[출판사서평 더 보기]

★ 이 책에서 다루는 내용 ★

■ 숫자 데이터에 대한 피처 엔지니어링: 필터링, 비닝, 스케일링, 로그 변환, 거듭제곱 변환
■ 텍스트 처리 기법: BoW(Bag-of-Words), n-gram, 구문 탐색
■ 정보가 없는 피처를 제거하기 위한 빈도 기반 필터링 및 피처 스케일링
■ 피처 해싱과 빈 카운팅 등을 포함하는 범주형 변수의 인코딩 기법
■ 주성분 분석(PCA)을 이용한 모델 기반 피처 엔지니어링
■ 피처 생성 기법으로 k-평균을 사용하는 모델 스태킹(model stacking)의 개념
■ 딥러닝을 이용한 이미지 피처 추출

★ 이 책의 대상 독자 ★

이 책은 ‘모델과 벡터가 무엇인지’와 같은 기본적인 머신 러닝 지식을 전제로 한다. 물론 그와 관련된 간단한 설명이 제공될 것이다. 선형대수, 확률분포, 최적화 등에 대한 경험이 이 책을 이해하는 데 도움은 되지만 꼭 필요하지는 않다.

★ 이 책의 구성 ★

처음 몇 장은 데이터 과학과 머신 러닝을 시작하려는 사람들을 위한 다리를 제공하고자 천천히 시작한다.
1장에서는 데이터, 모델, 피처 등 머신 러닝 파이프라인의 기본 개념을 소개한다.
2장에서는 숫자 데이터를 위한 피처 엔지니어링의 기본인 필터링, 비닝(binning), 스케일링(scaling), 로그 변환(log transform), 거듭제곱 변환(power transform), 상호작용 피처(interaction feature) 등을 살펴본다.
3장에서는 자연어 텍스트를 위한 피처 엔지니어링을 다루며 BoW(Bag-of-Words), n-grams, 구문 탐색 등의 기법을 살펴본다.
4장에서는 피처 스케일링의 한 예로 tf-idf(term frequency-inverse document frequency)를 살펴보고 그 동작 원리를 설명한다.
5장에서는 피처 해싱(feature hashing)과 빈 카운팅(bin counting)을 포함해 범주형 변수에 대한 효율적인 인코딩 기법을 논의하면서 진행에 속도를 높인다.
주성분 분석(PCA, Principal Component Analysis)을 다루는 6장에 이르면 머신 러닝의 세계에 깊이 들어서게 된다.
7장에서는 피처 생성 기법으로서 k-평균을 다루며, 유용한 개념인 모델 스태킹(model stacking)을 설명한다.
8장에서는 텍스트 데이터에 비해 피처 추출이 훨씬 어려운 이미지에 대해 다룬다. 여기서는 이미지에 대한 최신 피처 추출 기법이라고 할 수 있는 SIFT와 HOG, 두 가지 수동 피처 추출 기법을 살펴볼 것이다.
9장에서는 학술 논문에 대한 추천 모델을 생성하는 예제를 통해 몇 가지 서로 다른 기법을 비교 분석한다.

[출판사서평 더 보기 닫기]

책 속 한 문장

회원리뷰

이 책과 함께 구매한 책들

이 책이 속한 분야 베스트

교환/반품안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품안내
반품/교환방법

[판매자 페이지>취소/반품관리>반품요청] 접수
또는 [1:1상담>반품/교환/환불], 고객센터 (1544-1900)

※ 중고도서의 경우 재고가 한정되어 있으므로 교환이 불가할 수 있으며, 해당 상품의 경우 상품에 대한 책임은 판매자에게 있으며 교환/반품 접수 전에 반드시 판매자와 사전 협의를 하여주시기 바랍니다.

반품/교환가능 기간

변심반품의 경우 수령 후 7일 이내, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

※ 중고도서의 경우 판매자와 사전의 협의하여주신 후 교환/반품 접수가 가능합니다.

반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유

소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우(단지 확인을 위한 포장 훼손은 제외)

소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 예) 화장품, 식품, 가전제품 등

복제가 가능한 상품 등의 포장을 훼손한 경우 예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)

디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우

시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품이므로 단순 변심 및 착오로 인한 취소/교환/반품 시 해외주문 반품/취소 수수료 고객 부담 (해외주문 반품/취소 수수료는 판매정가의 20%를 적용

2) 중고도서 : 반품/교환접수없이 반송하거나 우편으로 접수되어 상품 확인이 어려운 경우

소비자 피해보상
환불지연에 따른 배상

- 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

- 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

판매자
북인북
판매등급
특급셀러
구매만족도
5점 만점에 5점
평균 출고일 안내
2일 이내
품절 통보율 안내
43%

바로가기

최근 본 상품