참고-predict 함수의 interval = “confidence”와 “prediction”의 차이 이해

(단순)선형회귀모형에서 새로운 X값에 대한 예측을 수행할 때, 구간 추정을 위해 interval 매개변수를 사용한 코드이다. > pred.frame <- data.frame(X = seq(3.5, 14.5, 0.2)) > #C-1. 구간으로-주어진 X의 Y평균(기댓값)에 대한 신뢰구간(신뢰대) 추정 > pc <- predict(market.lm, int = “confi”, newdata = pred.frame) > #C-2. 구간으로-주어진 X값의 Y값 예측구간(예측대) 추정 > pp <- predict(market.lm, int = “predi”, newdata…

세미나-SQL Server Machine Learning 서비스(R 기반) 소개

SQL Server Machine Learning 서비스(R 기반) 소개 안녕하세요, 지난 번 부산에서 진행한 세미나 이제 서울에서도 다시 진행합니다. 서울은 4시간으로 진행할 수 있어서 좀 더 여유있게 많은 내용 다룰 수 있습니다 😀 상세 내용과 등록은 아래 참조하세요. SQL ML 얘기도 들어보실 겸 리프레쉬도 할겸 그리고 업계 사람들도 만나뵐 겸 많이 많이들 오세요^^ 그리고 주변에도 많이 공유해…

RUCK 2018 (R in Korea) 봉사자 활동

RUCK 2018 (R in Korea) http://ruck2018.r-kor.org/  작년부터 개인적으로 R 공부를 시작했고, 올 해부터는 방송대 정보통계학과에 들어가 통계학 공부를 시작했습니다. RUCK 행사가 있다는 것을 알고 있었다가 마침 2018년도 행사 오픈과 함께 봉사자를 모집하고 있어서 참여하게 되었습니다. 제가 등록대 바로 옆 복도에서 안내자 역할을 맡은 관계로 오고 가는 분들을 모두 볼 수 있었고, 꽤 많은 분들에게 행사장…

R in SQL 자습서-4-SQL 개발를 위한 데이터베이스에서 R 분석(자습서)

R in SQL 자습서 시리즈-4 SQL 개발를 위한 데이터베이스에서 R 분석 Microsoft의 오픈 소스 프로젝트인 docs.microsoft.com에 있는 SQL Server Machine Learning Servece 중 아래 링크에서 볼 수 있는 자습서(Tutorial)의 한글 번역에 참여했습니다(총 4개). 번역 문서를 직접 보셔도 되지만, 제가 번역한 모든 내용이 반영되어 있지는 않은 관계로 제가 별도로 문서 전체를 공유합니다. 어느 쪽이든 편한 문서를…

R in SQL 자습서-3-RevoScaleR로 데이터 과학 심층 분석

R in SQL 자습서 시리즈-3 RevoScaleR로 데이터 과학 심층 분석 Microsoft의 오픈 소스 프로젝트인 docs.microsoft.com에 있는 SQL Server Machine Learning Servece 중 아래 링크에서 볼 수 있는 자습서(Tutorial)의 한글 번역에 참여했습니다(총 4개). 번역 문서를 직접 보셔도 되지만, 제가 번역한 모든 내용이 반영되어 있지는 않은 관계로 제가 별도로 문서 전체를 공유합니다. 어느 쪽이든 편한 문서를 보시면…

R in SQL 자습서-2-R과 SQL Server용 데이터 과학 전체 과정 연습

R in SQL 자습서 시리즈-2 R과 SQL Server용 데이터 과학 전체 과정 연습 Microsoft의 오픈 소스 프로젝트인 docs.microsoft.com에 있는 SQL Server Machine Learning Servece 중 아래 링크에서 볼 수 있는 자습서(Tutorial)의 한글 번역에 참여했습니다(총 4개). 번역 문서를 직접 보셔도 되지만, 제가 번역한 모든 내용이 반영되어 있지는 않은 관계로 제가 별도로 문서 전체를 공유합니다. 어느 쪽이든…

R in SQL 자습서-1-Transact-SQL에서 R코드 사용하기

R in SQL 자습서 시리즈-1 Transact-SQL에서 R코드 사용하기 Microsoft의 오픈 소스 프로젝트인 docs.microsoft.com에 있는 SQL Server Machine Learning Servece 중 아래 링크에서 볼 수 있는 자습서(Tutorial)의 한글 번역에 참여했습니다(총 4개). 번역 문서를 직접 보셔도 되지만, 제가 번역한 모든 내용이 반영되어 있지는 않은 관계로 제가 별도로 문서 전체를 공유합니다. 어느 쪽이든 편한 문서를 보시면 됩니다. https://docs.microsoft.com/ko-kr/sql/advanced-analytics/tutorials/sql-server-r-tutorials?view=sql-server-2017…

SQL Server Machine Learning(R기반) 세미나 소개@부산

SQL Server Machine Learning(R기반) 세미나 소개 등록: http://www.bitec.or.kr/ (등록 마감되었어요 ㅠㅠ) 장소: 부산정보산업진흥원 (부산글로벌IT교육센터) 대상 : Machine Learning 서비스에 관심 있는 SQL Server 사용자 시간 : 2018-10-22 19:00 ~ 22:00 내용: 왜 SQL Server Machine Learning 서비스인가? R 언어 간단 리뷰 (SQL 사용자를 위한 ‘R’) SQL Server Machine Learning 서비스 소개 무엇을, 어떻게, 얼마나 할 수…

참고-표본 분산은 왜 n-1로 나누는가?

참고-표본 분산은 왜 n-1로 나누는가? 처음 접할 때 그 이유가 궁금한 대표적인 주제이죠? 저도 그랬습니다 😀 SQL에서도 VAR vs. VARP, STDEV vs. STDEVP 가 궁금했었거든요. 물론 SQL로 그 차이를 풀어 설명할 수 있지만 왜 n-1가에 대해선 알 수가 없어 궁금했습니다. 학과 스터디에서 선배님들에게 설명을 들어 이해는 하지만, 제가 수학력이 약해서 수학적/공식적으로 직접 설명하는 것이 어려우므로…

참고-quantile() or summary vs. fivenum()

일반적으로 통계학 개론에서 설명하는 (사)분위수의 결과를 R/Excel 에서 확인해 보면 사전에 짐작한 수치와 다르게 나오는 경우가 있다. R 내에서도 fivenum과 quantile(or summary)이 다르다. 물론 Excel에서도 Quantile, Quantile.INC(EXC)가 다르다. 왜 그럴까? 궁금해서 찾아봤다. 참 쉽지 않았다, 관심 있는 사람들이 많지 않나 보다^^; 차후 필요 시 참고하기 위해 관련 링크와 간단히 정리한 내용을 적어둔다. 이 글을 읽으시는…