본문 바로가기

Programming

(8)
빅데이터 분석기사 7회차 1유형 문제 import pandas as pdfile = '/content/yemoonsaBigdata/datasets/Part5/ex7/07.01.01-students_scores.csv'df = pd.read_csv(file)print(df.head())print('-'*100)print(df.info())print('-'*100)print(df.describe())print('-'*100)df1 = df[['Statistics','DataScience','MachineLearning','EnglishLiterature']]subject_counts = df1.count()print(subject_counts)print('-'*100)most_popular_subject = subject_counts.idxma..
파이썬 기초 정리 1 # 📌 1. random_state=42의 의미 # 랜덤한 과정을 재현 가능하게 만들기 위한 설정입니다. # 42는 관행적으로 자주 쓰이는 숫자이며, 어떤 숫자든 가능함 from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=42) # 📌 2. 결측치 확인 코드 # 결측치가 1개 이상 존재하는 컬럼만 출력 print("결측치 확인") print("Train:", train_df.isnull().sum()[train_df.isnull().sum() > 0]) print("Test:", test_x_df.isnull().sum()[test_x_df.isnull().sum() > 0]) # 📌 ..
빅데이터 분석기사 8회차 3문항 1번 문제 statsmodels에서는 상수항을 자동으로 안 넣어주기 때문에 sm.add_constant()를 씀p-value는 변수가 의미있는지 판단하는 기준이라 0.05 초과 변수는 제거함오즈비(odds ratio)는 이탈 확률이 얼마나 증가하는지를 직관적으로 알려줌 (예: 4.7배 증가) # 📌 라이브러리 불러오기import pandas as pdimport statsmodels.api as smimport numpy as np# 📂 데이터 불러오기 (고객 이탈 여부 포함)data_file = '/경로+파일명.csv"df = pd.read_csv(data_file)# 🎯 종속변수(y)는 이탈 여부, 독립변수(X)는 그 외 나머지X = df.drop('churn', axis=1)y = df['ch..
빅데이터 분석기사 7회차 실기 2유형 # 데이터 파일 읽기 예제 import pandas as pd train_file = '07.02.01-sales_train_dataset.csv' X_test_file = '07.02.02-sales_test_dataset_x.csv' train = pd.read_csv(path + train_file) X_test = pd.read_csv(path + X_test_file) # pd.DataFrame({'index': X_test.index, 'y_pred': pred}).to_csv('003000000.csv', index=False)print(train.info()) print(X_test.info()) print(train.isnull().sum())print(X_test.isnull().su..
빅데이터 분석기사 7회차 실기 1유형 23년 7회1유형1. 주어진 데이터 세트는 학생들의 과목별 점수 데이터다. 수강과목은 통계, 데이터사이언스, 머신러닝, 교양영어이다.학생들은 이 중 3과목을 선택하여 들었으며, 이에 대한 점수를 받았다.가장 많은 학생이 들었던 과목을 구하고 결측치를 제거한 후 해당과목의 점수를 표준화하여 가장 높은 점수를 소수 둘째자리로 반올림하여 구하시오 #데이터 불러오기import pandas as pdfile = path +'07.01.01-student_score.csv'df = pd.read_csv(file) #, encoding = 'cp949' # 데이터 정보 확인(head())print(df.head())df.info()#수치형 데이터 기술통계 확인하기print(df.describe()) #과목별 수강 카..
빅데이터 분석기사 실기 준비 파이썬 공부를 혼자하다보니 재미가 없었다.그래서 자격증을 목표로 공부하면서 기본 베이스를 쌓아볼겸 준비해봤다. 연습환경https://dataq.goorm.io/exam/3/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%EC%B2%B4%ED%97%98/quiz/1%3Fembed?embed 구름EDU - 모두를 위한 맞춤형 IT교육구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/edu.goorm.io
빅데이터 분석기사 25년도 고사장 빅데이터 분석기사 25년도 1회 차 실시 고사장이 발표됐습니다.작년엔 서버가 터져서 못들어가다가 막상 나중에 들어가니 고사장이 없어서 신청 못했거든요. 올해도 천하제일 접수대회 한번 도전해봐야죠!! 안되면 제주도라도 가야겠어요 ㅎㅎ 큐넷처럼 미리 공개하면 좋을 텐데 시험임박해서 공개하는 이유를 모르겠네요.올해는 서버 안터지려나.... 매년 서버 터져서 10시에 접수해도 실상 11시 다돼서 접수하는 사람 많더라고요. 아 그리고 접수 관련 주의사항도 꼭 참고하세요. 할 말 많지만... 그렇다네요2시간 내에 결제 안 하면 자동취소라네요. 2시간 내에 접수는 될런지 ^^차라리 큐넷에 위탁해 줬으면 좋겠습니다!
Python BeautifulSoup Install 안녕하세요 오늘은 파이썬을 이용한 웹크롤링에 많이 사용되는 라이브러리중 하나인 BeautifulSoup에 대해 알아보겠습니다. 먼저 BeautifulSoup이 설치되었는지 확인해야합니다. (파이썬 설치 단계 및 기본적인 사용법은 아래 링크를 참고하셨으면 해요) 파이썬 설치 단계 및 사용방법 - Python Install Process & Basic Function from bs4 import Beautifulsoup 이라고 입력했을때 아래와 같은 문구가 뜬다면 설치가 안된겁니다. Traceback (most recent call last): File "", line 1, in from bs4 import Beautifulsoup ModuleNotFoundError: No module named 'bs4'..