상세 컨텐츠

본문 제목

[Python] 구글 코랩에 로컬PC 데이터 불러오기

Python

by 대학원생D군 2023. 4. 19. 09:00

본문

반응형

안녕하세요,

지난 포스팅에서 구글 코랩에 대하여 알아보았습니다. 코랩은 기본적으로 무료로 GPU를 사용할 수 있다는 장점이 있으나 기존의 로컬에서 작업을 하는 것에 익숙한 분에게는 자료를 불러오는 것부터 번거로운 작업일 수 있습니다.

 

[DATA] 데이터 사이언스의 시작, 구글 코랩 추천

안녕하세요. 요즘 머신러닝, 딥러닝, 강화학습 등을 공부하거나 실제 업무에 활용하시는 분들이 많습니다. 뿐만 아니라 초등학생들도 코딩을 배운다고 합니다. 그러나 빅데이터, 즉 대용량 데이

paratussemper.tistory.com

이번 포스팅에서는 로컬 PC에 저장된 데이터를 구글 코랩에 불러오는 방법을 살펴보겠습니다.

우선 아래의 코드를 코랩에서 실행합니다.

from google.colab import files
uploaded = files.upload()

코드를 실행하면 아래와 같이 파일 선택 탭이 생깁니다. 파일 선택을 클릭한 후 원하는 데이터를 업로드하면 됩니다. 저는 SAS 포스팅에서 자주 활용한 sashelp.class 데이터셋을 sashelp라는 파일명을 갖고 있는 csv파일을 업로드하였습니다.

다음으로 pandas, io 패키지를 구동한 후 pd.read_csv를 사용해서 데이터를 불러옵니다. io.StringIO도 사용할 수 있으나 저는 io.BytesIO를 사용하였습니다.

import io
import pandas as pd

df = pd.read_csv(io.BytesIO(uploaded['sashelp.csv']))
반응형

데이터가 잘 들어왔는지 살펴보기 위하여 df.head()를 사용하였습니다. 데이터가 예쁘게 잘 들어온 것을 확인할 수 있습니다.

df.head()

pandas 패키지의 describe() 함수를 이용하여 sashelp.class 데이터셋의 기술통계량도 구해보았습니다. 평균(mean), 표준편차(std), 최솟값(min), 최댓값(max) 뿐만 아니라 4 분위 수도 제공하네요.

df.describe()

이상으로 구글 코랩에 로컬 PC에 저장된 데이터를 불러오는 방법을 살펴보았습니다.

 

궁금하신 점은 언제든 댓글로 담겨주세요:)

감사합니다!

☆ 제 코드는 정답이 아니며 틀린 부분이 있을 수 있으니 주의하여 활용하시기 바랍니다.

반응형

관련글 더보기

댓글 영역