728x90
반응형

dataframe 8

빈 Pandas DataFrame을 만든 다음 채우는 방법

질문 : 빈 Pandas DataFrame을 만든 다음 채우시겠습니까? pandas DataFrame 문서에서 시작합니다. http://pandas.pydata.org/pandas-docs/stable/dsintro.html 시계열 종류의 계산에서 값으로 DataFrame을 반복적으로 채우고 싶습니다. 따라서 기본적으로 A, B 열 및 타임 스탬프 행, 모두 0 또는 모두 NaN으로 DataFrame을 초기화하고 싶습니다. 그런 다음 초기 값을 추가하고 이전 행에서 새 행을 계산하는이 데이터를 살펴 row[A][t] = row[A][t-1]+1 정도입니다. 현재 아래와 같은 코드를 사용하고 있지만 다소 추한 것 같고 DataFrame으로 직접 또는 일반적으로 더 나은 방법이 있어야합니다. 참고 : 저는 ..

개발관련/other 2022.01.17

Python Pandas의 기존 DataFrame에 새 열 추가하는 방법

질문 : Python Pandas의 기존 DataFrame에 새 열 추가 연속 번호가 아닌 명명 된 열과 행이있는 다음 인덱싱 된 DataFrame이 있습니다. a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 'e' 를 추가하고 데이터 프레임에서 아무것도 변경하고 싶지 않습니다 (즉, 새 열의 길이는 항상 DataFrame과 동일 함). 0 -0.335485 1 -1.166658 2 -0.385571 dtype: float64 위의 예에 e 열을 어떻게 추가 할 수 있습니까? 답변 2017 편집 주석과 @Alexander에서 알 ..

Python으로 Pandas에서 CSV 파일을 읽을 때 UnicodeDecodeError

질문 : Python으로 Pandas에서 CSV 파일을 읽을 때 UnicodeDecodeError 30,000 개의 유사한 파일을 처리하는 프로그램을 실행하고 있습니다. 임의의 숫자가 중지되고이 오류가 발생합니다. File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\pars..

[R] 하위 집합 데이터 프레임에서 사용하지 않는 요인 수준 삭제

질문 : 하위 집합 데이터 프레임에서 사용하지 않는 요인 수준 삭제 factor 포함하는 데이터 프레임이 있습니다. subset 또는 다른 인덱싱 기능을 사용하여이 데이터 프레임의 하위 집합을 만들면 새 데이터 프레임이 생성됩니다. 그러나 factor 변수는 새 데이터 프레임에 존재하지 않는 경우에도 원래 수준을 모두 유지합니다. 이로 인해 패싯 플로팅을 수행하거나 요인 수준에 의존하는 함수를 사용할 때 문제가 발생합니다. 새 데이터 프레임의 요소에서 레벨을 제거하는 가장 간결한 방법은 무엇입니까? 예를 들면 다음과 같습니다. df

개발관련/other 2021.11.22

Pandas에서 DataFrame의 행을 반복하는 방법

질문 : Pandas에서 DataFrame의 행을 반복하는 방법 Pandas의 DataFrame 있습니다. import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df 산출: c1 c2 0 10 100 1 11 110 2 12 120 이제이 프레임의 행을 반복하고 싶습니다. 모든 행에 대해 열 이름으로 요소 (셀의 값)에 액세스 할 수 있기를 원합니다. 예를 들면 : for row in df.rows: print row['c1'], row['c2'] Pandas에서 가능합니까? 이 비슷한 질문을 찾았습니다. 그러나 그것은 나에게 필요한 답을주지 못합니다..

DataFrame 행 순서를 섞는 방법

질문 : DataFrame 행 셔플 다음 DataFrame이 있습니다. Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame은 csv 파일에서 읽습니다. Type 1이있는 모든 행이 맨 위에 있고 Type 2가있는 행, Type 3이있는 행 등이 뒤 따릅니다. Type 이 혼합되도록 DataFrame의 행 순서를 섞고 싶습니다. 가능한 결과는 다음과 같습니다. Col1 Col2 Col3 Type 0 7 8 9 2 1 13 14 15 3 ... 20 1 2 3 1 21 10 11 12 2 ... 45 4 5 6 1 46 16 17 18 3 ... 이것을 어..

Pandas 데이터 프레임에서 여러 열 선택

질문 : Pandas 데이터 프레임에서 여러 열 선택 다른 열에 데이터가 있지만 다른 변수에 저장하기 위해 추출하는 방법을 모르겠습니다. index a b c 1 2 3 4 2 3 4 5 'a' , 'b' 하고 df1에 저장하려면 어떻게해야합니까? 나는 시도했다 df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] 아무것도 작동하지 않는 것 같습니다. 답변 열 이름 (문자열)은 시도한 방식으로 분할 할 수 없습니다. 여기에 몇 가지 옵션이 있습니다. 어떤 변수를 잘라 내고 싶은지 컨텍스트에서 알고 있다면 목록을 __getitem__ 구문 ([] 's)에 전달하여 해당 열만보기를 반환 할 수 있습니다. df1 = df[['a', 'b']] 또는 이름이 아닌 숫자로 인덱싱하는 것이 중요..

728x90
반응형