[ python ] 영화 데이터 불러와서 확인하기
페이지 정보
작성자 웹지기 댓글 0건 조회 5,087회 작성일 21-03-05 11:49본문
영화 데이터 불러와서 확인하기
@@데이터 불러오기
최종목표 : 각 영화의 평균 평점이 4이상을 구하는 것.
# Readme
# user_id 사용자 아이디
# item_id 영화 아이디
# rating 영화 평점
# timestamp 평점 입력 시간
movieData = np.loadtxt('data/ratings.dat', delimiter='::', dtype=np.int64)
movieData
array([[ 1, 1193, 5, 978300760],
[ 1, 661, 3, 978302109],
[ 1, 914, 3, 978301968],
...,
[ 6040, 562, 5, 956704746],
[ 6040, 1096, 4, 956715648],
[ 6040, 1097, 4, 956715569]], dtype=int64)
1. 데이터 속성 확인은 필수 !
#배열 크기, 배열 차원수, 배열 전체 요소 개수
print(movieData.shape)
print(movieData.ndim)
print(movieData.size)
2. 전체 영화 평점 평균 구하기
ratings = movieData[:, 2]
np.mean(ratings)
3.581564453029317
3. 영화 아이디 1번인 영화의 평점 평균 구하기
특정 조건으로 배열의 요소값에 접근 : boolean index(true, false)
movieData[:, 1]
#해당하는 행에 true가 존재할 때 출력
movieData[movieData[:,1]==1]
array([[ 1, 1, 5, 978824268],
[ 6, 1, 4, 978237008],
[ 8, 1, 4, 978233496],
...,
[ 6032, 1, 4, 956718127],
[ 6035, 1, 4, 956712849],
[ 6040, 1, 3, 957717358]], dtype=int64)
#영화 아이디가 1이 아닌 것에 접근하는데 평점만 보고 싶다.
#전체 구문 사용시
movieData[movieData[:,1] !=1][:,2]
array([5, 3, 3, ..., 5, 4, 4], dtype=int64)
#짧은 구문으로 접근하기
movieData[movieData[:,1] !=1,2]
array([5, 3, 3, ..., 5, 4, 4], dtype=int64)
첨부파일
- ratings.dat (23.5M) 0회 다운로드 | DATE : 2021-03-05 11:49:10
댓글목록
등록된 댓글이 없습니다.