반응형 전체 글87 R로 알아보는 미국 치안지도 ( + USArrests ) R로 알아보는 미국 치안지도 ( + USArrests ) [ 목차 ] 1. 데이터 소개: USArrests 2. 데이터 전처리 및 군집분석 3. 미국 지도 시각화 4. 결과 해석 5. 자주 묻는 질문 (FAQ) 6. 마무리 및 시사점 미국 50개 주의 폭력 범죄 데이터(USArrests)를 기반으로 군집분석(K-means Clustering)을 통해 각 주를 범죄 유형별로 분류해보고, 그 결과를 미국 지도 위에 시각화해 보도록 하겠습니다. 1. 데이터 소개: USArrests USArrests는 R에 내장된 데이터로, 아래와 같은 정보를 담고 있습니다. Murder: 살인율 (10만 명당)Assault: 강도 발생 수UrbanP.. 2025. 4. 17. R 머신러닝, iris 품종 예측하기 R 머신러닝, iris 품종 예측하기 [ 목차 ] 1. iris 데이터셋 2. 데이터 시각화 (EDA) 3. 로지스틱 회귀분석 4. 랜덤포레스트 5. 모델 성능 비교 6. 결론 머신러닝을 공부하다 보면 꼭 한번은 만나게 되는 데이터셋이 있습니다.바로 iris 데이터셋입니다.오늘은 이 데이터를 가지고 두 가지 분류 모델인 로지스틱 회귀분석과 랜덤포레스트을 적용해 보고,어떤 모델이 더 정확하게 품종을 예측하는지 비교해보겠습니다. 1. iris 데이터셋 iris 데이터는 꽃받침과 꽃잎의 길이/넓이 정보를 통해 품종(Species)을 예측하는 아주 간단하면서도 효과적인 분류용 데이터입니다. data(iris) str(iris)입력 변수.. 2025. 4. 17. R을 활용한 당뇨병 데이터 분류 분석 R을 활용한 당뇨병 데이터 분류 분석 [ 목차 ] 데이터 소개 및 탐색적 분석 데이터 전처리 모델링 및 성능 평가 모델 성능 비교 시각화 결론 및 제안사항 분석 결과의 시사점 보고서는 Kaggle에 제공된 "Pima Indians Diabetes Database" 데이터를 사용하여, 당뇨병 여부를 정확히 예측하는 최적의 분류 모델을 찾기 위한 분석을 수행합니다. 또한 시각화 기법을 활용하여 데이터 특성을 시각적으로 이해하고자 합니다. 데이터 소개 및 탐색적 분석- 데이터 출처캐글(Kaggle): Pima Indians Diabetes Database 캐글(diabetes) 바로가기 - 데이터 구성변수명설명데이터 타입Preg.. 2025. 4. 16. 수면 시간과 스트레스가 수면의 질에 어떤 영향을 줄까? ( + R 회귀분석 ) 수면 시간과 스트레스가 수면의 질에 어떤 영향을 줄까? [ 목차 ] 프로젝트 개요 사용한 데이터 R코드 분석 분석 결과 요약 시사점 및 마무리 1. 프로젝트 개요 요즘 사람들, 다들 잠 잘 자고 계신가요?수면은 하루의 피로를 풀어주는 중요한 시간인데요. 그런데 수면 시간이 충분해도, 또는 스트레스가 많을 때, 수면의 질은 과연 어떻게 변할까요?이번 포스팅에서는 Kaggle에서 제공하는 수면 건강 데이터를 기반으로수면 시간과 스트레스 수준이 수면의 질(Quality of Sleep)에 어떤 영향을 미치는지 R로 회귀분석을 통해 알아보겠습니다. 2. 사용한 데이터 출처: Kaggle - Sleep Health and Lifestyle Datas.. 2025. 4. 9. 중선형 회귀모델 , 교육, 평판, 여성 비율로 알아보는 연봉 예측 모델 ( +R코드 ) 중선형 회귀모델로 알아본 연봉 예측 모델[ 목차 ] 사용한 데이터는 중선형 회귀분석 예측 예시 변수별 시각화 요약 성별 격차 분석 결론 어떤 직업이 연봉이 높을까요?교육 수준, 직업 평판, 성별 비율 같은 요소들이 연봉에 어떤 영향을 줄까요?오늘은 간단한 통계 모델을 이용해 직업 데이터(Prestige.csv)를 기반으로 연봉을 예측하고, 성별 격차까지 분석하여 데이터로 들여다보는 사회구조와 성별 격차에 대해 알아보겠습니다. 🧾 사용한 데이터는?Prestige.csv라는 공개 데이터를 사용했습니다.education: 평균 교육 연수prestige: 직업의 사회적 평판 점수women: 여성 종사자 비율 (%)income: 평균 연봉.. 2025. 4. 7. R로 회귀 모델 만들기 : cars 주행 속도와 제동 거리 R로 회귀 모델 만들기 : 주행 속도와 제동 거리 [ 목차 ] 데이터 확인 산점도 그리기 선형회귀모델 예측하기 회귀선 그리기 마무리 R의 내장 데이터셋인 cars를 활용해 속도(speed)와 제동 거리(dist) 사이의 관계를 분석해 봅시다. 1. 데이터 확인첫 번째 단계는 데이터의 구조를 살펴보는 것입니다. cars는 R에 기본으로 내장된 데이터셋으로, 두 개의 열로 구성되어 있습니다.speed: 자동차의 속도 (단위: mph)dist: 해당 속도에서 정지하기까지의 제동 거리 (단위: ft)이 데이터를 통해 우리는 속도와 제동거리 사이에 어떤 관계가 있는지 분석하게 됩니다. 2. 산점도 그리기 산점도(Scatter plot)는 두.. 2025. 4. 3. 이전 1 2 3 4 5 6 ··· 15 다음