안녕하세요,
지난 포스팅에서 구글 코랩에 대하여 알아보았습니다. 코랩은 기본적으로 무료로 GPU를 사용할 수 있다는 장점이 있으나 기존의 로컬에서 작업을 하는 것에 익숙한 분에게는 자료를 불러오는 것부터 번거로운 작업일 수 있습니다.
[DATA] 데이터 사이언스의 시작, 구글 코랩 추천
안녕하세요. 요즘 머신러닝, 딥러닝, 강화학습 등을 공부하거나 실제 업무에 활용하시는 분들이 많습니다. 뿐만 아니라 초등학생들도 코딩을 배운다고 합니다. 그러나 빅데이터, 즉 대용량 데이
paratussemper.tistory.com
이번 포스팅에서는 로컬 PC에 저장된 데이터를 구글 코랩에 불러오는 방법을 살펴보겠습니다.
우선 아래의 코드를 코랩에서 실행합니다.
from google.colab import files
uploaded = files.upload()
코드를 실행하면 아래와 같이 파일 선택 탭이 생깁니다. 파일 선택을 클릭한 후 원하는 데이터를 업로드하면 됩니다. 저는 SAS 포스팅에서 자주 활용한 sashelp.class 데이터셋을 sashelp라는 파일명을 갖고 있는 csv파일을 업로드하였습니다.
다음으로 pandas, io 패키지를 구동한 후 pd.read_csv를 사용해서 데이터를 불러옵니다. io.StringIO도 사용할 수 있으나 저는 io.BytesIO를 사용하였습니다.
import io
import pandas as pd
df = pd.read_csv(io.BytesIO(uploaded['sashelp.csv']))
데이터가 잘 들어왔는지 살펴보기 위하여 df.head()를 사용하였습니다. 데이터가 예쁘게 잘 들어온 것을 확인할 수 있습니다.
df.head()
pandas 패키지의 describe() 함수를 이용하여 sashelp.class 데이터셋의 기술통계량도 구해보았습니다. 평균(mean), 표준편차(std), 최솟값(min), 최댓값(max) 뿐만 아니라 4 분위 수도 제공하네요.
df.describe()
이상으로 구글 코랩에 로컬 PC에 저장된 데이터를 불러오는 방법을 살펴보았습니다.
궁금하신 점은 언제든 댓글로 담겨주세요:)
감사합니다!
☆ 제 코드는 정답이 아니며 틀린 부분이 있을 수 있으니 주의하여 활용하시기 바랍니다.
[PYTHON] 워드클라우드 만들기 기초 (사이트 추천, 영어문장) (0) | 2023.04.26 |
---|---|
[Python] Bokeh 패키지 반응형 선 그래프 시각화 (0) | 2023.04.24 |
[Python] 구글 코랩으로 구글 드라이브 데이터셋 불러오기 (1) | 2023.04.20 |
[Python] 데이터 사이언스의 시작, 구글 코랩 추천 (0) | 2023.04.14 |
댓글 영역