파이썬, Python
-
[파이썬] . (점)을 찍어서 활용할 수 있는 함수들은 어떻게 확인할까?파이썬, Python/엑셀 대신 파이썬! 2023. 7. 10. 16:50
파이썬을 쓰다보면, .(점)을 찍어서 함수를 사용할때가 종종 있다.(아니 아주 많다) 물론 자주 사용하는건 외우고 있으면 좋겠으나, 가끔씩 사용하는 것 까지 외우기에는 우리의 두뇌가 할일이 그렇게 없지 않다. 그럼 마법의 함수를 확인해보자 age = 10 # age는 10이라는 정수를 입력했으니, # age 변수 타입은 int일 것이고, 그럼 int에서 사용할 수 있는 함수를 확인하려면? print(dir(age)) 그렇다, 변수의 타입을 확인하는 방법은 type(변수명) 을 입력하면 되고, 그 변수에서 사용할 수 있는 함수의 모음집을 보는 방법은 dir(변수명)
-
[필터] 엑셀에서는 할 수 없는 고급 필터링 파이썬으로 해보기.파이썬, Python/엑셀 대신 파이썬! 2023. 6. 29. 14:16
1. 특정 단어가 포함된 리스트를 필터링 하는 방법 예) '사원'이나 '대리' 중 하나라도 포함된 경우를 뽑고싶을때, grade_list = ['사원','대리'] grade_cond = df['GRADE'].isin(grade_list) # 1. loc를 쓰는 방법 df.loc(grade_cond) # 2. 이중 df를 걸어 필터링 하는 방법 df[grade_cond] 2. 필터링 해서 나온 항목들을 표시하기 예) '사원','대리' 필터링으로 나온 항목들에 '대상' 이라고 표시하고 싶을때, # '대상여부' 라는 컬럼에 '대상' 이라고 입력해보자. # 1. loc를 쓰는 방법 df.loc(grade_cond, '대상자') = '대상' # 2. 이중 df를 걸어 필터링 하는 방법 df[grade_cond][..
-
[error] cannot import name '_png' from 'matplotlib'파이썬, Python/엑셀 대신 파이썬! 2023. 6. 21. 23:03
가끔 matplotlib 을 사용할 때, 그와 연관된 라이브러리와 버전 호환이 안되어 오류가 발생할 때가 있다. 간단한 해결법. 일단 최신버전을 지우고, 옛날버전을 설치하자. 그중 나는 3.1.3 버전을 써보니깐 에러가 발생하지 않았다. # 우선 지우고 pip uninstall matplotlib # 버전을 특정해서 설치하자 pip install matplotlib==3.1.3
-
맨앞의 컬럼을 제외한 나머지 컬럼의 데이터 타입을 바꾸자!파이썬, Python/엑셀 대신 파이썬! 2023. 6. 21. 22:37
나머지 컬럼의 값이 object 타입이라 그래프를 그리거나 연산을 할 수 없을때, 해당 데이터 타입을 모조리 float 타입으로 변경해야할 때가 있다. 그런데!!! 맨앞의 컬럼이 날짜를 의미하는 datetime type일때, 해당 컬럼을 제외한 나머지 컬럼에 대한 값을 변경해야하는데 iloc 를 활용하자. import pandas as pd # 데이터프레임 생성 data = pd.DataFrame({'컬럼1': ['A', 'B', 'C'], '컬럼2': ['1.5', '2.7', '3.8'], '컬럼3': ['4.2', '5.3', '6.1']}) # 맨 앞의 컬럼을 제외한 나머지 컬럼의 데이터 형태를 float로 변경 data.iloc[:, 1:] = data.iloc[:, 1:].astype(floa..
-
RangeIndex ??파이썬, Python/엑셀 대신 파이썬! 2023. 6. 21. 21:40
가끔, 가로/세로 축을 전환하면, column명이 이상하게 나올때가 있다.(특히 숫자로) 이때, 컬럼명을 조회하면 RangeIndex 가 뜨면서, start=0 ~ 어쩌구 저쩌구 나오는데... 데이터프레임의 컬럼명 대신 "RangeIndex"가 출력된다면, 이는 데이터프레임의 인덱스 정보가 출력되었을 가능성이 있다. RangeIndex는 기본적으로 판다스가 인덱스를 자동으로 생성할 때 사용하는 인덱스 형식입니다. 나는 이 컬럼명들 말고, 그 아래 행에 있는 값들을 컬럼으로 지정하고 싶다. 다음과 같이 해보자. 'set_axis()' 함수를 이용하자. import pandas as pd # 임의의 데이터프레임 생성 data = pd.DataFrame([[1, 4, 7], [2, 5, 8], [3, 6, 9..
-
가로축과 세로축을 한번에 바꾸고 싶을 경우(행,열을 서로 바꾸기)파이썬, Python/엑셀 대신 파이썬! 2023. 6. 21. 21:36
가끔 통계청 데이터를 다운받아서 작업을 하려다 보면, 가로축에는 연도, 세로축에는 항목명이 나와있는데 이를 파이썬 matplotlib 혹은 seaborn을 써서 시계열로 시각화 하고 싶을때 살짝 어려움이 발생된다. 이럴때는, 아주 간단하게! transpose를 쓰면 된다. import pandas as pd # 임의의 데이터프레임 생성 data = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}) # 행과 열을 바꾼 전치된 데이터프레임 생성 transposed_data = data.transpose() # 결과 출력 print(transposed_data) 아니면, 훨씬 더 간단한 방법! T 를 활용하자. import pandas as pd ..
-
엑셀의 필터기능을 파이썬에서_(1) 일괄 값 입력파이썬, Python/엑셀 대신 파이썬! 2023. 6. 21. 00:07
파이썬을 쓰기가 꺼려지는 이유중에 하나가 엑셀의 가장 강력한 무기인, 눈으로 보면서 직접 필터링 하는 기능. 그리고 그 필터링한 값을 일괄로 변경하는 기능 때문이 아닐까 생각된다. 이 작업을 파이썬에서 어떻게 간단하게 수행할 수 있는지 알아보자. 파이썬에서 엑셀처럼 대용량 데이터의 가공 및 필터링을 위해서는, 판다스를 아주 살짝 알고 있어야 한다. 1) 엑셀의 필터기능 : 두가지 방법이 있고, 편한대로 하면 된다 import pandas as pd df = pd.read_csv('ddd.csv', dtype='object') # 1) 이중 df 처리 condition_1 = df['컬럼1'] == '1' df[condition_1] 이를 한줄로 간단하게 표현하면 아래와 같이 줄일 수 있고, df의 컬럼1..