Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- Python
- lambda
- HelloWorld
- jenv
- Ethereum
- docker
- geth
- web3
- apache-spark
- 블록체인
- Histogram
- web3@1.2.8
- nodejs
- Spark
- OpenCV
- Greeter
- pyspark
- solidity
- Apache Spark
- MAP
- word count
- python3
- macbook
- remix
- stopwords
- bigdata
- RDD
- node
- BlockChain
- 이더리움
Archives
- Today
- Total
목록big data (1)
이것저것 프로그래밍 정리(Macbook)
apache-spark 에서 word count하기(1) - pyspark
대문자, 소문자 변환 단어의 객수 count 하기, word count 하기를 앞서서 대문자로 되어있는 단어와 소문자로 되어있는 단어는 모두 같기 때문에 대소문자 변경하는 것을 먼저 알아보도록 하자. 먼저 예시 dataset을 만들어 보도록 하자. %%writefile data/ds_bigdata_wcex.txt big data big DaTa BiG data BIg DAta aPAche spArk aPache SpaRk ApaChe spArk ApaCHE Spark 위의 데이터를 사용하도록 하겠다. 항상 하던 것처럼 RDD를 생성해주고 단어를 분리 시켜주도록 하자. 이후 대문자로 만들어 주는 함수와 소문자로 만들어주는 함수를 만들어 주도록 하자. 만든 함수를 적용해서 각각 대문자와 소문자로 만들어 보도..
apache-spark(big data)
2020. 4. 27. 13:23