DATA TOOL/SAS

[프로그램 TIP] SAS 유니버시티 에디션과 파이썬 연결하기-2편

레디코 2020. 1. 18. 10:54

안녕하세요. 쏘피입니다.

 

 

 

 

지난 1편에서 SAS UNIVERSITY EDITION을 사용하는 방법을 알아보았습니다.

오늘은 SAS UNIVERSITY EDITION에서 PYTHON을 연결하는 방법을 알아보겠습니다.

 

1. SAS STUDIO에 접속해주시고 JupyterLab을 클릭해줍니다.

- SAS STUDIO 접속 방법: http://localhost:10080

- JupyterLab을 클릭해주시고 Python3을 선택합니다.

 

 

 

 

 

 

2. import saspy를 하고 pandas로 깃허브에서 데이터를 가져옵니다.

 

 

 

import saspy
import pandas as pd

# githyb에서 데이터 가져오기
df = pd.read_csv('https://raw.githubusercontent.com/zonination/perceptions/master/probly.csv')
df.describe()

 

3. 가지고 온 데이터를 df2sd 메소드를 사용하여 SAS 데이터 세트로 옮겨줍니다.

 

 

#SAS 기능 적용하기 위해서는 데이터를
#SAS 데이터 세트로 옮겨야 함: df2sd 메소드 사용
sas = saspy.SASsession()
probly = sas.df2sd(df,'PROBLY')
probly.describe()

 

3. SASPY는 통계, 머신러닝, 시계열 API 메소드를 제공합니다. 

해당 내용은 https://sassoftware.github.io/saspy/api.html에서 확인 가능합니다.

SAS를 기반으로 히스토그램을 그려보았습니다.

 

 

#SASPY는 통계, 머신러닝, 시계열 API메소드 제공
#https://sassoftware.github.io/saspy/api.html 참고
probly.hist(var='Likely')

 

 

4. 파이썬 코드로부터 SAS 코드가 어떻게 생성되는지 알고 싶다면 sas.teach me SAS를 사용합니다.

 

hist를 SAS에서 어떤 코드로 이뤄지는지 알려줍니다.

proc sgplot data=WORK.PROBLY; histogram Likely / scale=count; density Likely; run; title;

로 알려주는군요!

 

 

#파이썬 코드로부터 SAS코드 생성: SAS코드에 대해 배우고 싶다면 
# Teach me SAS
sas.teach_me_SAS('true')
probly.hist(var='Likely')

 

# SAS문 
cars = sas.sasdata("CARS","SASHELP")
cars.describe()
%%SAS
proc means data = sashelp.cars;
run;

 

5. 이제 SAS UNIVERSITY EDTION에서 작성했듯,

파이썬 JUPYTER에서도 PROC과 DATA 구문을 사용할 수 있게 되었습니다.

 

 

파이썬과 SAS를 혼용해서 쓰시는 분에게는 teach me sas가 유용한 기능이 될 것 같습니다.

그럼 이번 포스팅은 마무리하고 다음에는 다양한 활용 방법에 대해 포스팅 하겠습니다.