본문내용 바로가기

KYOBO 교보문고

sam X 갤럭시탭 s pen 한정판매
[보라]인싸작가님만나
2020다이어리
북모닝 12주년 이벤트
  • 수요낭독공감 11월 행사
  • 제5회 교보손글쓰기대회 수상작 전시
R로 하는 빅데이터 분석: 데이터 전처리와 시각화
* 중고장터 판매상품은 판매자가 직접 등록/판매하는 상품으로 판매자가 해당상품과 내용에 모든 책임을 집니다. 우측의 제품상태와 하단의 상품상세를 꼭 확인하신 후 구입해주시기 바랍니다.
| 규격外
ISBN-10 : 1196014477
ISBN-13 : 9791196014476
R로 하는 빅데이터 분석: 데이터 전처리와 시각화 중고
저자 김권현 | 출판사 숨은원리
정가
25,000원 신간
판매가
22,500원 [10%↓, 2,500원 할인]
배송비
2,500원 (판매자 직접배송)
지금 주문하시면 2일 이내 출고 가능합니다.
토/일, 공휴일을 제외한 영업일 기준으로 배송이 진행됩니다.
2019년 3월 1일 출간
제품상태
상태 최상 외형 최상 내형 최상
이 상품 최저가
20,990원 다른가격더보기
새 상품
22,500원 [10%↓, 2,500원 할인] 새상품 바로가기
수량추가 수량빼기
안내 :

중고장터에 등록된 판매 상품과 제품의 상태는 개별 오픈마켓 판매자들이 등록, 판매하는 것으로 중개 시스템만을 제공하는
인터넷 교보문고에서는 해당 상품과 내용에 대해 일체 책임을 지지 않습니다.

교보문고 결제시스템을 이용하지 않은 직거래로 인한 피해 발생시, 교보문고는 일체의 책임을 지지 않습니다.

판매자 상품 소개

※ 해당 상품은 교보문고에서 제공하는 정보를 활용하여 안내하는 상품으로제품 상태를 반드시 확인하신 후 구입하여주시기 바랍니다.

판매자 배송 정책

  • 토/일, 공휴일을 제외한 영업일 기준으로 배송이 진행됩니다.

더보기

구매후기 목록
NO 구매후기 구매만족도 ID 등록일
25 좋습니다 책상태도 좋아요 5점 만점에 5점 77ka*** 2019.11.12
24 감솨합니다^^ 고맙습니다~!! 5점 만점에 5점 cmw1*** 2019.11.09
23 `1234567890 5점 만점에 5점 p3*** 2019.11.08
22 잘 받았습니다. 책 상태 좋네요 5점 만점에 5점 rkd*** 2019.11.06
21 책상태 좋았고, 배송일도 2일내로 빨리 도착했습니다. 5점 만점에 5점 ahndr*** 2019.10.29

이 책의 시리즈

책 소개

상품구성 목록
상품구성 목록

이 책은 쿡북(Cookbook)이 아니다!

물론 프로그래밍 언어으로 원하는 목적을 달성하는 가장 빠른 방법은 이미 작동하는 소스 코드를 실행하는 것이다. 하지만 소스 코드를 고쳐야 한다면!?!

그 때부터는 수많은 문법오류, 논리오류(버그)에 잘 돌아가던 프로그램도 안 돌아가는 신비한 경험을 하게 된다. 그 버그란 무엇 때문에 생기는가? 실수, 수면부족, 주의 산만 등 다양한 원인이 있겠지만, 또 다른 주요 원인은 튼튼하지 못한 기초에 있다!

● NA > 3은 왜 NA이고, NA | TRUE는 왜 TRUE인가?
● 데이터테이블(data.table)의 복잡한 문법은 어떻게 이해해야 하는가?
● 정규표현식의 메타문자는 무엇이고, 어떻게 다루어야 하는가?
● ggplot2의 수많은 옵션은 어떻게 외워야 할까?

패키지, 벡터, 데이터프레임 등 기초부터 데이터테이블, 정규표현식, ggplot2까지
데이터 전처리와 시각화를 위한 핵심을 모두 담았다!

저자소개

저자 : 김권현
김권현은 서울대학교 인지과학 박사, 서울대학교 물리학 학사 출신으로 서울대학교 사회과학원 방법론 컨설턴트, 서울대학교 사회과학원 R 강의, 서강대학교, 국민대학교 등에서의 강의경험과 여러 참조 자료를 토대로 책을 썼다. R 패키지 mirt의 공헌자이고 datacamp.com에 기고 경험도 있다. ‘기초 통계학의 숨은 원리’, ‘수학의 숨은 원리’ 등의 저자이기도 하다.

목차

서문

1 들어가기
1.1 R … … … … … … … … … … … … 8

2 R의 패키지(Packages)
2.1 패키지 설치 … … … … … … … … … … . 9
2.2 패키지 관련 정보 … … … … … … … … … . 10
2.3 패키지 불러오기/확인하기/제거하기 … … … … … … 11
2.4 패키지 관리하기 … … … … … … … … … . 12
2.5 중복되는 함수와 변수 … … … … … … … … . . 12

3 R의 변수, 자료형, 연산/함수
3.1 R의 변수 … … … … … … … … … … . . 13
3.2 R의 데이터 타입(자료형) … … … … … … … … 17
3.3 연산(Operations)과 함수(Functions) … … … … … . . 20
3.4 특별한 값 … … … … … … … … … … . . 26

4 데이터 구조
4.1 벡터(Vector) … … … … … … … … … … 31
4.2 데이터 구조에 따른 생성, 참조, 수정, 추가, 삭제 함수 … … … . 43
4.3 CRUD(Create, Read, Update, Delete) … … … … … 51
4.4 3+차원의 배열 … … … … … … … … … . . 53

5 dplyr 패키지를 활용한 데이터 가공
5.1 magrittr의 파이프 연산자 … … … … … … … . . 59
5.2 dplyr의 방식: 부분 선택(Subsetting) … … … … … . . 62
5.3 dplyr의 방식 : 수정 … … … … … … … … . . 68
5.4 dplyr의 기타 편의 기능 … … … … … … … … . 74

6 날짜와 시간(Date and Time)
6.1 날짜의 표기 … … … … … … … … … … . 80
6.2 날짜 표기 변환 … … … … … … … … … . . 81
6.3 날짜시간 표기 인식 … … … … … … … … … 82
6.4 날짜, 시간 연산 … … … … … … … … … . . 89
6.5 날짜(시간)의 특정한 정보 참조 … … … … … … … 90
6.6 날짜(시간) 갱신 … … … … … … … … … . 90
6.7 활용예 … … … … … … … … … … … 93

7 팩터형 데이터타입
7.1 팩터형의 중요성 … … … … … … … … … . 96
7.2 데이터 전처리에 있어서 팩터형 … … … … … … … 96
7.3 forcats 패키지 … … … … … … … … … . . 98

8 R로 데이터 읽어오기
8.1 R 내장 데이터 … … … … … … … … … . . 101
8.2 들어가기 : write.table/read.table, save/load … … … . . 102
8.3 텍스트로 저장된 데이터 화일 읽기 … … … … … … . 103
8.4 EXCEL 화일 읽기 … … … … … … … … … 110
8.5 그 밖의 통계 프로그램 데이터 화일 … … … … … … . 111

9 데이터 가공
9.1 집단별로 함수 적용하기 … … … … … … … … . 114
9.2 여러 데이터 프레임 합치기 … … … … … … … . . 119
9.3 세로형/가로형 변환 … … … … … … … … … 125

10 패키지 데이터테이블(data.table)
10.1 package:dplyr과 package:data.table의 비교 … … … … . 127
10.2 data.table의 키(key) 활용하기 … … … … … … . . 143
10.3 data.table을 활용한 병합 … … … … … … … . . 148
10.4 그 밖의 특수한 기호 : .SD, .GRP, .N, .I, .BY, .EACHI … … … . 157
10.5 데이터테이블 종합 … … … … … … … … … 165

11 문자열(character)
11.1 인코딩 … … … … … … … … … … … 167
11.2 대표적인 인코딩 방법 … … … … … … … … . . 168
11.3 그 밖의 인코딩 방법 … … … … … … … … … 168
11.4 R에서 인코딩 다루기 … … … … … … … … . . 169
11.5 R에서 문자열 입력 … … … … … … … … … 171
11.6 유니코드 정규화(Normalization) … … … … … … . 173
11.7 문자열의 정렬 … … … … … … … … … … 174
11.8 문자열을 다루는 함수들 … … … … … … … … . 176
11.9 패키지 stringr을 활용한 문자열 관리 … … … … … . . 182

12 정규표현식
12.1 R과 정규표현식 … … … … … … … … … . . 185
12.2 확장정규표현식(ERE; Extended Regular Expressions) … … . 186

13 흐름 제어와 함수
13.1 제어문: 조건과 반복 … … … … … … … … . . 201
13.2 함수 … … … … … … … … … … … . 209

14 기술 통계량
14.1 1변수 기술 통계량
14.2 데이터 프레임의 모든 변수(컬럼)에 대해 요약통계치 구하기

15 간편 시각화
15.1 간편 시각화의 예 … … … … … … … … … . 222

16 ggplot2
16.1 들어가기 … … … … … … … … … … . . 227
16.2 시각적 맵핑(Aesthetic mapping) … … … … … … . 229
16.3 기하학적 대상(geom) … … … … … … … … . . 248
16.4 보조선(Auxillary lines) … … … … … … … … 257
16.5 좌표계(Coordinate system) … … … … … … … . 259
16.6 범례(Legends) … … … … … … … … … . . 265
16.7 제목과 테마(Title and Theme) … … … … … … . . 267
16.8 결과 정리 및 저장 … … … … … … … … … . 273
16.9 ggplot2(gg = Grammar of Graphics) 총정리 … … … … 275

17 연습문제 해답
데이터 불러들이기 … … … … … … … … … … 279
제어와 함수 I… … … … … … … … … … … 282

부록 1. R에서 하는 벡터/행렬 연산
벡터연산 … … … … … … … … … … … . . 283
한 행렬 연산 … … … … … … … … … … … 283
두 행렬의 연산 … … … … … … … … … … . . 284
선형(행렬) 대수 … … … … … … … … … … . 285

부록 2. R의 색, 세계 타임존

부록 3. 치트시트

책 속으로

출판사 서평

이 책은 어느 정도 프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 이 책은 시중의 책들과 달리 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리...

[출판사서평 더 보기]

이 책은 어느 정도 프로그래밍 경험이 있는 독자를 대상으로, 오픈 소스 데이터 분석 도구인 R을 활용하여 데이터를 불러들이고, 가공하고, 시각화하는 방법을 설명한다. 이 책은 시중의 책들과 달리 특정한 기능을 하는 함수들을 설명하기 전에 데이터 전처리의 목적과 기능에 대한 개념적인 이해를 우선 할 수 있도록 도와준다. 그리고 날짜시간 자료형, 문자열 자료형, 정규표현식 등에 대한 원리와 응용 방법을 자세하게 설명하여 복잡한 전처리 과정에서도 논리적 오류를 범하지 않도록 한다. 분산처리 없이 빅데이터 처리를 할 수 있는 마지막 보류인 데이터테이블을 dplyr 패키지의 함수와 비교하여 이해를 도왔고,ggplot2의 설명에서는 플롯의 수많은 옵션을 정하는 방법을 한 눈에 보기 싶게 보여준다. 그 밖에도 부록으로 RStudio의 치트시트를 수록하였다. 어느 정도 R에 익숙한 독자들에게도 R의 데이터 전처리와 시각화에 대해 좀 더 깊이 알 수 있게 하였다. 레퍼런스 북으로도 손색이 없다.

● R 최신 버전 3.5.2(2018-12-20) 반영
● 빅데이터 분석을 위한 최선의 선택-data.table 패키지(최신버전 1.12.0)에 대한 설명 수록
● RStudio의 ggplot2(최신버전 3.1.0) 등 패키지 치트시트(cheatsheet) 수록
● 백과사전식의 나열이 아니라 개념 중심의 체계적인 이해 중시
● 좀 더 테크니컬한 심층 활용 방법과 오류를 사전에 방지하는 방법 설명
● 각종 참고 자료 및 표 수록
● 다양한 원서의 내용 종합
- Spector(2008). Data Manipulation with R.
- Kabacoff(2015). R in Action: Data Analysis and Graphics with R
- Wickham(2016). ggplot2: Elegant Graphics for Data Analysis.
- Lander(2017). R for Everyone: Advanced Analytics and Graphics.
- Wickham & Grolemund(2017). R for Data Science.
- Van Der Loo & De Jong(2018). Statistical Data Cleaning with Applications in R.
● ds.sumeun.org 홈페이지 운영

[출판사서평 더 보기 닫기]

책 속 한 문장

회원리뷰

  • R로 하는 빅데이터 분석 | sk**3i | 2019.03.09 | 5점 만점에 5점 | 추천:0
    IT 기술이 발달하면서 수집할 수 있는 데이터의 양이 많아지고, 빅데이터의 중요성이 날로 커져왔다. 회사에서 웹 관련 업무를 ...

    IT 기술이 발달하면서 수집할 수 있는 데이터의 양이 많아지고, 빅데이터의 중요성이 날로 커져왔다. 회사에서 웹 관련 업무를 수행하면서 얻게 되는 데이터들을 어떻게 하면 유의미하게 활용할 수 있을까 고민하면서 빅데이터를 공부하고 있다. 예전에는 통계 패키지라하면 SPSS와 SAS 등이 주로 언급되었는데 이제는 R과 파이썬이 많이 쓰이는 것 같다. 특히 R은 무료로 제공되기에 실제 연구자들이 많이 사용하는 것으로 알고 있다.  


    기존에 R관련된 프로그래밍 서적을 보았는데, 주어진 튜토리얼을 진행하는 방식이다. 이러한 쿡북 방식의 설명은 주어진 환경과 조금이라도 벗어나게 되면 해결하기 어려워진다. 그래서 이 책의 저자는 R언어의 문법에 대해 상세히 다루고 있다. 쿡북 방식이 실습 예제를 수행하면 진행되는 결과를 바로 확인할 수 있기 때문에 진도는 빠르지만, 공부한 파트의 깊이가 다소 부족해진다. 이를 문법 교재로 보충할 필요를 느낀다. 


    사실 다른 프로그래밍 언어를 배워본 경험이 있기에, 문법이 다소 지루한 편이다. 데이터를 다루는 통계 패키지이기에 데이터 관련 문법이 많고 복잡하다. R이 타 개발 언어에 비해 쉽다고 들은 것에 비해 실제로 배워보니 상대적이라는 느낌이 든다. 모든 프로그래밍 문법이 그러하듯이 처음부터 완벽하게 이해하고 넘어가기엔 갈 길이 멀다. 전체적으로 가볍게 읽으면서 여러 번 반복해서 익숙해질 필요가 있다.  


    프로그래밍 경험이 없는 입문자라면 조금 어려울 수 있다. 개인적으로 R 공부와 함께 통계에 대한 전반적인 지식도 함께 보면서 빅데이터를 공부해야겠다. 

  • 4차 산업 시대에서 '빅 데이터'는 매우 핫한 화두이다. 그래서 우리는 빅 데이터가 정확히 무엇인지 잘 알지는 못하지만 그것이...

    4차 산업 시대에서 '빅 데이터'는 매우 핫한 화두이다. 그래서 우리는 빅 데이터가 정확히 무엇인지 잘 알지는 못하지만 그것이 중요하다는 것을 잘 알고 있다. 사실 빅 데이터는 그 단어의 뜻대로 엄청난 양의 방대한 데이터를 의미할 것이다. 그렇다면 그 방대한 데이터가 왜 중요하다는 것일까.

    그 데이터를 잘 가공하여 원하는 정보를 얻어냈을 때의 파급력이 매우 크기 때문이다. 어찌 보면 우리가 살고 있는 환경 자체가 데이터 그 자체일 것이다. 어제 킨텍스에 있었던 박람회에 갔었는데 근 시일 내에 자율주행차가 센서나 레이더 혹은 라이더를 통해 생성해내는 정보의 양이 분 단위에 수 테라바이트라고 한다. 그렇다면 그렇게 얻어진 데이터를 어떻게 분석하느냐가 앞으로는 매우 중요한 문제가 될 것이다. 그래야 자동차를 스스로 움직이게 할 것이고, 인공지능이 제대로 작동하게 될 것이기 때문이다.


    프로그램 R에 대해서는 지난번에 <데이터 분석 전문가를 위한 R 데이터 분석>이라는 책을 소개하면서도 이야기했었다. 로 하는 빅 데이터 분석>에 소개된 내용을 다시 한번 간략하게 소개하자면, R은 1993년 뉴질랜드 오클랜드 대학의 통계학과 교수인 로스 이하카 Ross Ihaka와 로버트 젠틀맨 Robert Gentleman이 만들었다. R은 통계 언어인 S와 S+의 계보를 잇고 있지만, 무료이며 오픈 소스 프로젝트로 개발되고 있다. 따라서 누구나 인터넷에서 다운로드해 사용해 볼 수 있으며 필요하다면 소스 코드도 검증하고 수정할 수 있다.

    그리고 이 책을 통해 새롭게 알게 된 것은 R은 패키지를 가지고 있는데, R을 다양한 분야에 활용하기 위해 부족한 부분이 있을 수 있으니 특정 분야에서 필요한 기능을 구현하여 모아 놓은 확장팩의 개념이라고 볼 수 있다.

    자, 여기까지가 이 책의 3%도 채 안 되는 부분의 내용이다. 이 이후에는 솔직히 한글이지만 읽어도 이해할 수 없는 부분들이 주류를 이루었다.


    R은 지난번에도 느꼈지만, 프로그램 언어를 이용하여 원하는 데이터를 분석하고 가공할 수 있다. 게다가 통계학적 개념과 지식을 응용해야만 한다. 따라서 기본적인 지식과 어느 수준의 통계적 이해가 없이는 활용이 불가능한 프로그램이다.

    로 하는 빅 데이터 분석>의 부제 '개념적 기초에서 심층 활용까지 데이터 전처리와 시각화'의 내용처럼 나와 같은 초초보도 따라 하면 기초에서 심층 활용까지 가능하지 않을까 하는 헛된 기대와 무지에서 시작된 도전이 부끄러운 결과를 낳게 되었다.


    하지만 이 책이 희망적인 것은 지난번 책에서는 다루지 않았던 데이터 구조부터 시작하여 데이터를 읽어오고 데이터를 가공하고 시각화하는 것들에 대해서 보다 친절하게 설명하고 있다는 것이다. 자, 가장 이상적인 방법은 이런 내용을 모두 숙지하고 있고 원하는 데이터를 분석해 낼 수 있는 전문가를 초청하는 것이다. 하지만 그런 전문가에게 빅데이터 분석을 요청하기 위해서라도 빅 데이터 분석이 어떻게 이루어지는지 대략적인 개념을 이해해야 한다. 그래서 원하는 바를 요청하고 원하는 결과를 얻어낼 수 있기 때문이다. 혹은 이렇게 공부하여 내가 빅 데이터 전문가가 되는 것도 하나의 방법이 될 수 있을 것이다.

    아직 갈 길이 멀다. 하지만 여러 가지 관심을 두고 있는 책들과 함께 씨름하다 보면 조금은 나아지지 않을까 하는 소박한 기대를 해본다.

  • IT계열이지만 빅데이터 분야와는 다른 쪽으로 일을 하고 있습니다. 그러나 향후 신기술 중 가장 관심있는 분야가 빅데이터 분야라...

    IT계열이지만 빅데이터 분야와는 다른 쪽으로 일을 하고 있습니다. 그러나 향후 신기술 중 가장 관심있는 분야가 빅데이터 분야라서 개인적으로 공부해보겠다는 결심을 했습니다. 이것저것 검색을 통해 빅데이터 분석을 위해 최근 가장 각광받고 있는 것이 R이라는 것을 알게 되었습니다. 그리고 R에 대해 공부할 수 있는 책을 찾아보다 이 책을 발견했죠. 저자는 '전체적인 맥락을 알고 큰 그림을 그릴 수 있다면 훨씬 수월하다'는 말처럼 R에 대해 좀 더 쉽게 이해할 수 있도록 책을 썼습니다.


    1장에서는 R의 간단한 특성을 소개하고 2장에서는 R의 패키지 설치방법을 소개하고 있습니다. 그리고 3장부터는 다른 프로그래밍 언어처럼 R의 변수와 자료형,연산/함수 등을 다룹니다. 변수할당과 관리, 데이터 타입에 따른 연산과 함수 등 문법적으로 조금 다른 부분이 있긴 하지만 프로그래밍을 접해보신 분들이라면 큰 무리없이 이해하고 따라할 수 있습니다. 4장에서는 벡터, 행렬, 배열, 데이터 프레임, 리스트 등 R의 데이터 구조를 설명합니다. 


    또 R로 데이터 읽어오기, 분석에 접합한 상태로 데이터를 가공하기, 인코딩, 정규표현식, 흐름제어와 함수 방대한 내용을 일일이 다 설명하기란 어려울만큼 방대한 내용들을 소개하고 있습니다. 저도 이제 막 R을 공부하려는 입장이기에 책의 모든 내용을 다 이해하지는 못했습니다. 그러나 명렁어를 입력하고 출력되는 결과를 바로 아래에 표시해두는 형식으로 구성되어 있어 차분히 잘 따라간다면 이론을 이해하고 실습을 하는데 큰 무리가 없을 것입니다. 


    그리고 이 책은 프로그래밍에 대한 기초지식을 어느 정도 갖춘 상태에서 읽는 것을 추천드립니다. 기초지식이 전혀 없이도 책을 읽는 것이 가능은 하겠지만 그러기엔 R과 이 책을 이해하는데 많은 시간이 소요될 것 같아요. 또 개인적으로 조금 아쉬운 부분은 책의 디자인 적인 부분입니다. 후반부에 그래프 등을 표현하기 위해 일부 컬러 페이지가 들어간 부분을 제외하곤 대부분 흑백 컬러로 되어 있습니다. 책의 디자인이나 스타일보다 내용 자체가 훨씬 중요하고 내용 자체는 충실하게 잘 쓰여 있습니다. 그러나 디자인 면에서 조금 더 보완했으면 하는 아쉬움이 남네요. 잘 읽었습니다.

  • 충실한 R학습서 | xn**is | 2019.03.06 | 5점 만점에 5점 | 추천:0
    R은 통계학에서 발전한 통계분석 도구라고 합니다. 4차산업혁명의 한 중추인 빅데이터...

    R은 통계학에서 발전한 통계분석 도구라고 합니다. 4차산업혁명의 한 중추인 빅데이터를 놓고 보면 빅데이터의 중요핵심인 데이터분석을 R이 맡고 있습니다. 결국 R을 익숙하게 익혀야 가능할겁니다. 물론 데이터분석은 R만 하는건 아닐겁니다. 파이썬도 가능하고, SQL로만으로도 가능하다고 합니다. 하지만 데이터분석도구로 칼날처럼 시퍼렇게 방법론을 가다듬어온 R은 무조건 익혀야할 기본 도구일겁니다. 로 하는 빅데이터 분석>은 빅데이터분석을 하는데 있어서 데이터를 전처리를 하고 결과가 나오면 이해하기쉽게 시각화하는 방법까지 소개하는 본격적으로 전반적인 R의 활용을 다룬 책이라 할수있습니다.

     

    저자는 김권현입니다. 이분은 서울대에서 물리학과를 나오셔서 인지과학박사를 하셨군요. 그리고 저자가 R에 대한 사랑을 보여준 점이 이 책 자체가 R패키지를 이용하여 작성되었다는 겁니다. R패키지 "bookdown"을 이용했다고 합니다. 이렇다보면 책의 편집이 약간 어색해보이는 측면이 있지만 R을 이용해 책도 만드는 구나를 알게된 R 활용범위가 얼마나 넓은지 이해할 수있는 측면이었습니다. 그리고 이 책이 R을 공부하는데 매우 믿음직했던 점은 저자가 명지대, 국민대생을 가르치면서 더욱 다듬어져서 실제 적용성이 증명되었기에 데이터분석을 위해 편안하게 이 책을 고를 수있는 측면입니다. 작년의 결과물을 보고 싶으다면 김권현github으로 검색을 하면 학생들의 결과물도 볼수가 있습니다.

     

    R이 활성화된건 최근 10여년정도 였습니다. 활성화의 근간은 공짜라는 겁니다. 소위 오픈소스계열로 발전을 해왔습니다. 그 전에는 대부분 SPSS나 미니탭 등 비싼 유료프로그램을 사용해서 데이터정리를 해왔습니다. 이제는 SPSS나 미니탭 SAS를 쓰지 않아도 좋은 결과를 낼수있게 된겁니다. 그럴수있게 된점은 R의 기능중에 패키지가 매우 중요한 역활을 합니다. R패키지는 통계를 편하게 할수있도록 만들어 논 기능집합이라 할수가 있습니다. 이 책에서도 dplyr , ggplot2를 핵심으로 다양한 패키지를 소개합니다.

    처음에 나오는 psych패키지는 describe를 이용한 기술통계량을 편하게 만들고 dplyr를 이용해서는 psych를 이용할 수있게도 데이터가공을 정확하게 할수있게 해줍니다. 원래 raw데이터라는 것이 노이즈가 많은 것이 많습니다. 더우기 최근에 생성되는 데이터는 쓰레기 덩어리같은 경우도 경우도 많습니다. 그래서 그 자료를 의미있는 결과를 만들려면 쓰레기더미같은 데이터를 정리하는 데 원래 많은 시간이 들어갑니다. dplyr이 바로 데이터를 일정한 형식으로 정리하게 도와주는 역활을 합니다. 그 외에도 tidyr, data.table, lattice, xml,stringr 등 요소요소에 편하게 사용할 패키지를 소개를 합니다.

     

    R은 현재도 진화중인 통계분석도구입니다. 이제는 파이썬이 주로 담당하는줄 알았던 머신러닝의 영역도 R도 합니다. 그 영역까지 발전하기 위해서는 로 하는 빅데이터분석>에서 소개한 내용은 반드시 숙지를 해야 제대로 된 데이터전처리, 기술통계, 시각화 등을 무리없이 처리할 수있게 된다는 겁니다. 과거 엑셀을 정말 잘하는 사람은 VBA를 할수있는 능력이 있어야 했습니다. 이제는 R로 VBA영역을 모두 무리없이 처리하는 정도가 아니라 더욱 발전적으로 업무처리를 가능하게 해줍니다. 사회과학전공자들은 논문통계를 위해 기본적으로 SPSS를 해야 합니다. 이제는 R로 대체가 가능하고 더만은 일을 처리할수있습니다. 물론 이 책한권정도는 씹어먹어야 가능하기는 합니다. 그리고 그것을 하게하는데 필요한 핵심을 이 책이 다루고 있었습니다.

교환/반품안내

※ 상품 설명에 반품/교환 관련한 안내가 있는 경우 그 내용을 우선으로 합니다. (업체 사정에 따라 달라질 수 있습니다.)

교환/반품안내
반품/교환방법

[판매자 페이지>취소/반품관리>반품요청] 접수
또는 [1:1상담>반품/교환/환불], 고객센터 (1544-1900)

※ 중고도서의 경우 재고가 한정되어 있으므로 교환이 불가할 수 있으며, 해당 상품의 경우 상품에 대한 책임은 판매자에게 있으며 교환/반품 접수 전에 반드시 판매자와 사전 협의를 하여주시기 바랍니다.

반품/교환가능 기간

변심반품의 경우 수령 후 7일 이내, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

※ 중고도서의 경우 판매자와 사전의 협의하여주신 후 교환/반품 접수가 가능합니다.

반품/교환비용 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
반품/교환 불가 사유

소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우(단지 확인을 위한 포장 훼손은 제외)

소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 예) 화장품, 식품, 가전제품 등

복제가 가능한 상품 등의 포장을 훼손한 경우 예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집

소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)

디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우

시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우

전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우

1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품이므로 단순 변심 및 착오로 인한 취소/교환/반품 시 해외주문 반품/취소 수수료 고객 부담 (해외주문 반품/취소 수수료는 판매정가의 20%를 적용

2) 중고도서 : 반품/교환접수없이 반송하거나 우편으로 접수되어 상품 확인이 어려운 경우

소비자 피해보상
환불지연에 따른 배상

- 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됨

- 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함

판매자
책책북북
판매등급
특급셀러
판매자구분
일반
구매만족도
5점 만점에 5점
평균 출고일 안내
2일 이내
품절 통보율 안내
23%

바로가기

최근 본 상품