본문 바로가기

카테고리

3장: 수치를 통한 연속형 자료의 요약 Reporting Date: June. 30, 2024 연속형 자료가 어떤 값을 중심으로 분포되어 있는가를 나타내는 중심위치의 측도,각 자료가 중심위치의 값으로부터 흩어진 정도를  나타내는 퍼진 정도의 측도 등을 다루고자 한다.   1 .  자 료 의   입 력## 교재 출처 최하단에 표시 ### 예제13: 정량 100인 음료수 80병을 임의로 추출하여 그 내용물의 실제 측정된 양을 잰 자료이다.(p.42)import numpy as np# 변수 drink에 NumPy 배열을 할당drink = np.array([98, 99, 100, 99, 99.4, 101.7, 98.8, 101.8, 101.5, 101.8, 102.6, 101, 98.8, 101.4, 99.7, 99.7.. 더보기
2장: 표와 그림을 통한 자료의 요약 Reporting Date: June. 9, 2024 자료를 효과적으로 요약하고 이해하기 위해 표나 그림을 사용하는 방법에 대해 다루고자 한다.자료 요약은 분석 대상인 자료의 형태와 특성에 따라 다양한 방법으로 이루어진다. 1 .  자 료 의  입 력## 교재 출처 최하단에 표시 ### 예제1: 사망자 목록 중 130명을 임의로 추출, 이들의 사망원인을 10가지로 분류하였다.(p.35)import numpy as np# 변수 death에 NumPy 배열을 할당death = np.array([2, 1, 2, 4, 2, 5, 3, 3, 5, 6, 3, 8, 3, 3, 6, 3, 6, 5, 3, 5, 2, 6, 2, 3, 4, 3, 2, 9, 2.. 더보기
워드 클라우드(Wordcloud) Reporting Date: June. 1, 2024  Reporting Date: May. 25, 2024  수행된 크롤링을 바탕으로이스라엘 전쟁에 관한 뉴스 기사를  워드 클라우드로 생성하는 작업을 수행하였다. 코드는 크게 불용어 제거,  토큰화,  빈도 계산,  워드 클라우드 생성의  4 단계로 나누어져 있다.    1 .  Python librariesimport re # 정규표현식 사용: 텍스트 데이터를 클렌징import pandas as pd # 데이터 프레임 사용import os # 파일의 존재 검사from collections import Counter # 단어의 빈도수 계산import nltk # 자연어 처리: 텍스트 토큰화를 위해 사용from nltk.tokenize import wor.. 더보기
크롤링(Crawling) Reporting Date: May. 25, 2024  "이스라엘 전쟁" 에 대한  1 개월 기간의 네이버 뉴스 기사들을 크롤링하여뉴스 제목과 내용을 수집하고, 이를  CSV 파일로 저장하는 작업을 수행하였다.코드는 크게 로깅 설정,  크롤링 함수 정의,  크롤링 실행,  데이터 저장의  4 단계로 나누어져 있다.  1 .  Python  libraries import requests # 웹 페이지 내용 가져오기import logging # 로그 메세지 기록 및 관리import pandas as pd # 데이터 구조화 및 분석을 위한 데이터 프레임 생성from tqdm import tqdm # 진행 상황을 시각적으로 표시from bs4 import BeautifulSoup # HTML 문서 파싱 및 원하.. 더보기
Python 100 문제 풀이를 했던 Python 100 문제 중, 코드의 효율성과 가독성을 개선할 필요성이 있는 두 가지 문제를 선정하여, 기존 코드와 이를 보완한 새로운 코드에 대한 각각의 설명을 작성하였다. 문제 1 - 24더보기더보기더보기이 코드는 현재 시간과 임무 시작 시간 간의 차이를 계산하여, 남은 시간을 시, 분, 초 형식으로 출력하는 코드이다.# 현재 시간 입력current_time = input().split(':')current_hour = int(current_time[0])current_minute = int(current_time[1])current_second = int(current_time[2])# 임무 시작 시간 입력start_time = input().split(':')start_hour .. 더보기