Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- jenv
- Python
- BlockChain
- docker
- Apache Spark
- OpenCV
- solidity
- python3
- stopwords
- Histogram
- MAP
- RDD
- pyspark
- remix
- word count
- web3
- lambda
- macbook
- Greeter
- web3@1.2.8
- 블록체인
- 이더리움
- HelloWorld
- Ethereum
- node
- Spark
- bigdata
- nodejs
- geth
- apache-spark
Archives
- Today
- Total
목록MachineLearning (1)
이것저것 프로그래밍 정리(Macbook)
apache-spark ML을 이용한 Logistic Regression - pyspark
Logistic Regression(로지스틱 회귀)은 발생할 결과 값이 이진인 경우의 분류에 적용합니다. 예를 들어 환자의 데이터로부터 병의 유무, 이메일이 스팸인지 아닌지 등 이진 분류일 때 적용 가능합니다. 예제를 통해 pyspark에서 Logistic Regression의 사용법을 알아보도록 하겠습니다 건강 지표들을 통해 심장병의 유무에 대해 예측해보고 얼마나 정확한지 측정해 보도록 하겠습니다. 0. 필요 라이브러리 import하기 필요한 라이브러리들을 먼저 import 해놓도록 하겠습니다. 1. 데이터 불러오기 다음 아래의 csv 파일을 DataFrame으로 불러오도록 하겠습니다. 위 사진과 같이 trainDf를 생성해 주었습니다. trainDf의 column들은 다음과 같습니다. 현재 train..
apache-spark(big data)
2020. 12. 22. 16:09