개발관련일지

PY ] 판다스 자주 사용하는 코드 정리 본문

개발기록/PYTHON

PY ] 판다스 자주 사용하는 코드 정리

BEECHANGBOT 2020. 7. 21. 13:31
train = pd.read_json('/path')

making_df = {'num' : [1,2,3,4,5,6,7,8]}
made_df = pd.DataFrame(making_df)

train_list = train[['col1','col2']].values.tolist() 
#컬럼 1 2 를 배열로 변환

train[['col1','col2','col3','col4']].to_csv('/content/drive/My Drive/',encoding='utf-8-sig')
#해당 컬럼들만 csv파일로 저장

for i in train.index: #트레인 인덱스로 포문돌림

count_list = list(pd.value_counts(count_list)[:100].index)
# 리스트에 [1 2 3 4 5 1 2 3 1 1 2] 이렇게있으면 중복되는 순으로 카운트해서 앞에서 100개만 짤라줌

train.col1 of train['col1']  #해당 컬럼 선택

train.loc[row1] #인트 스트링 상황에 맞게 사용
train.loc[:] #전체 불러오기

train['col6'] = train['col6'].map(lambda x: list(filter(lambda x: not(x[0]) in no_use_items, x)))
# 형태소분석기 쓸떄 사용한 코드인데 col6의 아이템중에 no_use_items이 포함되어있지 '않은것'만 사용
# 원랜 필터메소드가 있는거만 사용인데 앞에 not을 붙여서 반대로 사용하였음 

train["want_add_col"] = train["sample_dol"].map(lambda x : dic[str(x)])
#컬럼을 생성할때 df에 가지고있는 값을 이용하고 싶을떄 불러온후 map lambda x로 사용하도록한다 딕셔너리말고 포문으로도 가능함

train[['col1']].values # 해당컬럼 벨류로 반환 타입 확인하기
train[['col1']].values[0]# 0번쨰 로우에 있는 값 반환

for i in train.index:
    title = train.loc[i,"col1"]
    if "test" in title: 
#테스트란 스트링이 타이틀에 포함되어잇으면 이프문 실행   
 
df = pd.DataFrame.from_dict(using_dic, orient='index')
# using_dic을 이용해서 판다스로 변형함

df = df.sort_values(["item_count"], ascending=[False]) 
# item_count 오름차순으로 정렬

train[train["컬럼명"]=="찾고자하는단어"]

'개발기록 > PYTHON' 카테고리의 다른 글

PY ] 파이썬 포메팅 ( formatting )  (0) 2020.04.20