일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- matplotlib
- Google Spreadsheet
- string
- Github
- GIT
- PostgreSQL
- PANDAS
- Excel
- 파이썬
- SQL
- hive
- Apache
- Redshift
- Java
- array
- gas
- dataframe
- Mac
- Tkinter
- c#
- google apps script
- math
- django
- Python
- PySpark
- Kotlin
- Google Excel
- numpy
- list
- Today
- Total
목록백분위 (4)
달나라 노트
pandas DataFrame에서 어떻게 Percentile Rank를 계산하는지 봅시다. (백분위, 백분위수에 대한 이해를 기반으로 합니다. 백분위 관련 개념 습득을 위해서는 아래 글을 참고하면 좋습니다.) https://cosmosproject.tistory.com/826 백분위(Percentile Rank), 백분위수(Percentile), 사분위수(Quartile) 알아보기 수학, 통계, 데이터 분석 등 다양한 곳에서 백분위라는 말이 쓰입니다. 수능 성적을 받아도 백분위라는 것이 있죠. 이 백분위라는 것이 무엇이고, 왜/어떻게 쓰이며, 어떻게 계산할 수 있는지 알 cosmosproject.tistory.com import pandas as pd dict_test = { 'col1': [ 10, 2..
numpy의 percentile() method는 어떠한 값들을 기준으로 백분위를 구하고 그 값들 사이에서의 백분위수를 return해주는 기능을 합니다. (백분위에 대한 개념을 알고 싶으면 아래 글을 참조하면 좋습니다.) https://cosmosproject.tistory.com/826 백분위(Percentile Rank), 백분위수(Percentile), 사분위수(Quartile) 알아보기 수학, 통계, 데이터 분석 등 다양한 곳에서 백분위라는 말이 쓰입니다. 수능 성적을 받아도 백분위라는 것이 있죠. 이 백분위라는 것이 무엇이고, 왜/어떻게 쓰이며, 어떻게 계산할 수 있는지 알 cosmosproject.tistory.com Syntax numpy.percentile( a=array, q=percen..
수학, 통계, 데이터 분석 등 다양한 곳에서 백분위라는 말이 쓰입니다. 수능 성적을 받아도 백분위라는 것이 있죠. 이 백분위라는 것이 무엇이고, 왜/어떻게 쓰이며, 어떻게 계산할 수 있는지 알아봅시다. 1. 백분위(Percentile Rank), 백분위수(Percentile)란? 한 세트의 여러 값들이 있을 때 각각의 값들이 이 세트 내에서 어느 정도의 위치에 존재하는지를 0% ~ 100%의 숫자로 표현하는 것을 백분위(Percentile Rank)라고 합니다. 보통 값들을 오름차순하여 정렬한 후 가장 작은 값은 0% 라는 백분위를 가장 큰 값은 100% 라는 백분위를 가지게 되며 그 사이의 값은 크면 클수록 더 100%에 가까운 값을 가지게 됩니다. 백분위수(Percentile)는 이렇게 계산된 한 세..
데이터를 다루다 보면 전체에 대한 백분위를 구할 때가 있습니다. 이럴 때에는 percentile이라는 유용한 함수를 사용할 수 있습니다. Syntax percentile(column, percent) - column 백분위를 구할 데이터가 있는 대상 column - percent 상위 몇%를 의미 Table = test_table col1 col2 a 1 a 2 a 3 b 1 b 6 b 7 c 1 c 2 d 2 d 2 d 4 d 1 위같은 table이 있다고 가정합시다. select col1 , percentile(col2, 0.5) as result_col from test_table -- group by col1 ; col1 result_col a 2 b 6 c 1.5 d 2 쿼리와 결과입니다. 결과..