디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] 문피아 조회 수 분석 2

김통계;갤로그로 이동합니다. 2021.01.19 09:45:23
조회 2675 추천 26 댓글 33
														

이번 글은 산점도를 통해 자료의 속성을 파악하는 것에 초점을 맞춘다.

글을 시작하기 전에 선호작에 대한 가정을 할 필요가 있다. 선호작을 등록한다는 것은 그 사람이 해당 작품을 재미있다고 평가한다고 가정한다. 이 가정은 선호작 수를 기반으로 조회 수와 생존율, 조회 수-추천의 비율을 비교할 때 쓰인다.



선호작 수를 이용한 유료화 이후 조회 수 예측


먼저 유료화 이전의 선호작 수와 조회 수의 산점도를 보자.

viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af4646af09bacfb34569aad0fe54436ab1819cbe708e652580d1bb1

선호작 수가 증가함에 따라 조회 수도 증가하는 경향을 확인할 수 있다. 그러나 이 글에서 초점을 맞추는 부분은 유료화 이전의 선호작 수가 유료화 이후의 조회 수를 예측할 수 있는지이다. 따라서 같은 시점에서 측정한 선호작-조회 수가 아닌 유료화 이전의 선호작 수와 유료화 이후의 조회 수를 비교하여 경향성을 확인한다.


viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af4646af09bacfb34569aad0fe54436ab1c44cab05fb5515849dc1b

유료화 이전의 선호작 수가 유료화 이후의 조회 수는 어느 정도 비례 관계에 있는 듯이 보인다. 하지만 자료가 선호작 수의 증가에 따라 조회 수의 분산이 커지는 형태를 보이고 있으므로 등분산 가정이 불가능하며, 회귀분석을 진행할 수 없다. 따라서 조회 수를 로그 변환하여 자료의 분산을 보정한다.



viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af4646af09bacfb34569aad0fe54436fb1548c8e409e0015879240f

분산이 로그함수를 따르는 형태가 되었다. 이 경우 직선을 가정한 추정이 아닌 곡선을 가정한 추정이 진행되어야 한다. 그러나 그러한 추정은 방식과 해석이 모두 복잡하므로 선호작 변수를 다시 로그 변환하여 변수의 선형성을 확보한다.


viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af4646af09bacfb34569aad0fe54436fd154f9eb75cb20158f83d86

이제 변수가 직선 위에 놓인 형태가 되었다. 회귀 모형 추정 결과 F값은 110.480으로 유의한 결과가 나타났다. 추정된 회귀식은 다음과 같다.

회귀식 = 2.848 + 0.953x

위 식의 경우 x, y를 모두 로그 변환 하였으므로 탄력성의 개념으로 해석해야 한다. 즉, x값이 10%변화할 때 y값이 9.53% 변화한다는 식이다. 따라서 유료화를 하기 전에 선호작 수가 10% 증가한다면 유료화 이후의 총 조회 수가 9.53% 증가할 것으로 기대할 수 있다.

총 조회 수를 종속변수로 사용하는 것은 연재한 편수에 따라 결과가 왜곡될 수 있다는 지적을 할 수 있다. 따라서 편당 조회 수를 로그 변환한 값의 평균(편당 조회 수 평균값)을 이용하여 다시 추정한다.



viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af4646af09bacfb34569aad0fe54436ac4a1ccbe55fe301588bda76

F값은 162.646으로 나타나 유의함을 보였으며, 추정된 회귀방정식은 다음과 같다.

회귀식 = -5.085 + 1.351x

위에서와 마찬가지로 해당 모형은 선호작 수가 10% 증가할 때 유료화 이후 편당 평균 조회 수가 13.51% 증가한다고 해석한다.



선호작 수를 통한 조회 수와 생존율의 비교

viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af464079d99a4f43502eff6780a72db35b77fd837800fdb7d5458

각각 유료화 이전의 선호작 수를 x축으로 하여 유료화 이후의 평균 조회 수(Log)와 생존율을 y축에 나타낸 그림이다. 조회 수는 선호작 수가 증가함에 따라 증가하는 반면, 생존율은 ㄱ자 모양을 보인다.
두 변수의 분포 형태가 다른 것은 두 변수가 서로 다른 속성을 반영하고 있음을 의미한다. 조회 수의 경우 낮은 선호작임에도 높은 조회 수를 보이는 작품이 없는 반면, 생존율의 경우 선호작 수가 적더라도 높은 생존율을 유지하는 작품이 있음을 알 수 있다.
이러한 차이는 조회 수가 보편적인 재미를 반영하는 반면, 생존율이 해당 작품의 독자들이 느끼는 재미를 반영하기 때문이라고 해석할 수 있다. 즉, 마이너한 취향을 노리는 글들은 비록 적은 조회 수를 보이더라도 그 독자들을 오래 끌고 가는 것이 생존율을 통해 나타나는 것이다.
한편, 유료화 이전의 선호작 수는 높으나 생존율은 낮은 작품들도 있다. 이들은 초반부의 재미를 통해 많은 선호작을 끌어낼 수 있었으나 유료화 이후 그 재미를 유지하지 못하여 많은 독자들이 이탈한 형태로 해석할 수 있을 것이다.

따라서 조회 수와 생존율은 각기 다른 방식으로 해석되어야 한다. 조회 수는 자신의 작품이 가진 보편적인 재미이다. 조회 수를 끌어올리는 것은 자신의 작품이 보다 대중적이고 취향을 적게 타는 모습을 갖추어 나간다는 것을 의미한다. 반면 생존율은 자신의 작품과 취향이 맞는 독자들이 해당 글에 얼마나 재미를 느끼고 있는지를 의미한다. 조회 수가 낮더라도 생존율이 높으면 그 작가는 마이너한 취향을 정확하게 공략하여 충성도가 높은 독자를 만든 것이다.

작가는 평균적인 생존율이 어느 정도인지를 통해서 자신의 글이 독자의 충성도를 끌어내고 있는지를 확인할 수 있으며, 생존율이 크게 떨어지거나, 반대로 떨어지지 않고 높게 유지되는 구간을 식별하여 독자들이 어느 부분에서 재미를 느끼는지를 확인할 수 있다.



생존율을 이용한 유료화 이후 조회 수 예측


viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af4646af09bacfb34569aad0fe54436ad4f44cbb60be304583582a3

생존율과 유료화 이후의 조회 수(Log) 산점도를 확인하면 직선 위에 놓여있는 형태임을 알 수 있다. 따라서 회귀분석을 진행하기에 적합한 형태임을 알 수 있다.

회귀분석 결과 F값은 28.408로 나타나 모형이 유의함을 확인하였다. 추정된 회귀식은 다음과 같다.

회귀식 = -76.492 +0.852x

이 모형의 경우 y를 로그 변환하였으므로 x값이 10 증가할 때 y값이 8.52% 증가한다는 형태로 해석할 수 있다. x값은 비율이며 y값은 변화량을 의미하므로 절편(-47.445)이 크게 의미 있는 정보는 아니다. 따라서 절편을 제외하고 분석해도 무방하다. 이 모형은 평균 생존율이 1% 증가할 때 편당 조회 수가 0.852% 증가한다고 해석한다.


추천 수를 이용한 유료화 이후 조회 수 예측


viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af4646af09bacfb34569aad0fe54436ad4e489bb95ae005585d0294

위 그림은 유료화 이전의 편당 추천 수의 평균값(Log)과 유료화 이후의 편당 조회 수 평균값(Log)의 산점도이다. 표본이 선 위에 정렬되어 있는 듯한 모습을 확인할 수 있으며, 회귀분석을 진행함에 있어서 무리가 없는 형태로 보인다.

회귀분석 결과 F값은 340.115로 유의하게 나타났다. 회귀식은 다음과 같다.

회귀식 = -1.029 + 1.352x

이 모형 역시 x, y 모두 로그 변환하였으므로 탄력성으로 해석한다. 즉, 유료화 이전의 추천 수가 10% 증가한다면, 유료화 이후 평균적인 편당 조회 수가 13.52% 증가할 것으로 예측할 수 있다.



댓글 수를 이용한 유료화 이후 조회 수 예측


viewimage.php?id=39bad92cefd63c&no=24b0d769e1d32ca73dec82fa11d02831d5ca5516da218d33b13f2760ba135b318fce934f2892964af4646af09bacfb34569aad0fe54436aa1f1bcae25bb30558e0c626

댓글 수 또한 유료화 이후의 조회 수를 예측할 수 있는 하나의 지표이다. 위의 그림은 편당 댓글 수를 로그 변환한 뒤 평균한 값과 편당 조회 수를 로그 변환한 뒤 평균한 값의 산점도이다. 즉, 유료화 이전의 편당 댓글 수를 통해 유료화 이후 편당 조회 수를 예측할 수 있다는 의미이다.

회귀분석 결과 F값은 143.592로 나타났으며 회귀식은 다음과 같다.

회귀식 = 2.908 + 1.387x

두 변수 모두 로그 변환하였으므로 탄력성으로 해석한다. 따라서 유료화 이전 편당 댓글 수가 10% 증가할 때 유료화 이후 편당 조회 수는 13.87% 증가할 것으로 예측할 수 있다.


Full Model의 구성

상기 네 변수를 동시에 사용하여 다중회귀분석을 실시하였다. 하지만 모형 구축에 있어서 다중공선성 문제가 발생하였기에 단계선택(stepwise) 방식으로 통해 Reduced Model을 구축하였다. 분석 결과 추천 수와 생존율을 이용한 모형이 채택되었다. 회귀식은 다음과 같다.

회귀식 = -37.235 + 1.199x1 + 0.38x2

x1은 추천 수를 로그 변환하여 평균한 값(=추천 수 변화량)이며, x2는 생존율이다. 모형은 독립, 종속 변수가 로그 변환되어 있으므로 탄력성 개념으로 해석한다. 즉, 추천 수, 생존율이 각각 1%씩 증가했을 때 유료화 이후의 조회 수는 1.199% + 0.38% 만큼 증가한다고 예측할 수 있다.

상기 모델은 전체 표본을 이용하여 예측한 값이므로 이용시에는 장르별 속성에 따라 예측에 오차가 발생할 수 있음을 고려해야 한다.

---

사실 위의 Full model을 통해서 정확한 예측이 가능할 것이라고는 생각하지 않습니다. 다만 산점도를 통해 변수들의 관계를 이해하고, 개별 회귀식을 이용하여 각 변수의 변화가 유료화 이후에 어떤 영향을 미칠 것인지 추정하는 정도로 쓰인다면 충분하다고 생각합니다.


세 줄 요약

1. 선호작 수, 추천 수, 생존율, 댓글 수로 유료화 이후의 조회 수를 예측할 수 있음.
2. 자세히는 본문 참고
3. 네 개 다 쓸 필요 없이 생존율이랑 추천 수, 두 개 변수만 가지고 충분한 예측이 가능함.


1편 링크
https://gall.dcinside.com/mgallery/board/view/?id=tgijjdd&no=431956&page=1









자동등록방지

추천 비추천

26

고정닉 2

2

댓글 영역

전체 댓글 0
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
- 설문 끝까지 다 본 걸 후회하게 만든 용두사미 드라마는? 운영자 25/07/07 - -
- AD 워터파크 지금이 제일 쌈! 운영자 25/07/11 - -
879671 공지 갤 규칙 통합 공지 V1.00 깜묵갤로그로 이동합니다. 23.12.04 23857 29
1033343 공지 프라이빗 문의 공간 (메일) [1] thisday갤로그로 이동합니다. 24.12.08 13836 8
447147 공지 웹소설 연재 갤러리 공지사항 (2021.02.24) 밤톨이^^갤로그로 이동합니다. 21.02.24 70465 70
958746 공지 신문고 [6] ㅇㅇ(223.38) 24.06.09 24572 12
434755 공지 유입 뉴비들을 위한 갤통합공지(V1.06) [1] 깜묵갤로그로 이동합니다. 21.01.25 115867 206
956351 공지 웹소설 입문자를 위한 가이드 ver.1.00 [47] 깜묵갤로그로 이동합니다. 24.06.02 43637 122
1114769 일반 이번 작 완결하고 나서 고민중인게 ㅇㅇ갤로그로 이동합니다. 17:55 10 0
1114768 일반 와 씨 에피소드 구상하고 나니까 50화 조금 넘겠네. ㅇㅇ(218.48) 17:55 7 0
1114767 일반 고딩 망생이 연재해보려고 하는데 진지한 감평 부탁드리겠습니다 ㅇㅇ갤로그로 이동합니다. 17:54 15 0
1114766 일반 일상 대화를 나누는 상황 쓰기 좆나 빡세네 [1] ㅇㅇ(121.164) 17:53 13 0
1114765 문피아 어쨌든 175화가느니 200화가 맞나요? [7] ㅇㅇ(125.143) 17:48 62 0
1114764 일반 볼때마다 신기하네 ㅇㅇ갤로그로 이동합니다. 17:48 21 0
1114763 일반 요즘도 최소 완결 200화인가요?? [12] ㅇㅇ(59.11) 17:43 88 0
1114762 일반 웹작가랑 지망생이랑 커뮤어디있음? [3] ㅇㅇ(124.80) 17:41 88 0
1114761 노벨피 난 급완결치면 이렇게 할듯 [1] ㅇㅇ갤로그로 이동합니다. 17:40 47 0
1114760 문피아 150화 완결 타플 [2] ㅇㅇ(125.143) 17:35 91 0
1114759 문피아 투베가 진짜 본격적인 독자 유입 시작이구나 [4] ㅇㅇ(58.233) 17:31 123 0
1114758 문피아 혹시 옛날에 올렸던거 리메이크 해도 되나요? [6] ㅇㅇ(112.153) 17:30 92 0
1114757 문피아 요즘 연독은 다들 보통 몇 화쯤에 보기 시작함? [2] ㅇㅇ갤로그로 이동합니다. 17:30 50 0
1114756 일반 노벨피아는 완결작 대우가 안 좋다는데 [4] ㅇㅇ(124.61) 17:27 94 0
1114755 일반 알고있어! 이거 대체 왜 집어 넣는거임? [7] ㅇㅇ(121.164) 17:23 141 0
1114754 문피아 초대박작은 보통 1~2질 친 신인 작가들이 많이 냈음 [4] ㅇㅇ갤로그로 이동합니다. 17:23 199 0
1114753 노벨피 난 요까지 해야겠다 [2] ㅇㅇ(39.123) 17:21 92 0
1114752 일반 떡밥이든 복선이든 발에 채일 듯이 깔아놔도 [5] ㅇㅇ(124.61) 17:16 107 0
1114751 문피아 요즘 매니저물은 별론가 ㅠㅠ [10] ㅇㅇ(106.101) 17:16 127 0
1114750 문피아 문피아 졸라 불만인게, 공백을 주고싶어도 줄수가없음 [4] ㅇㅇ(112.165) 17:15 130 0
1114749 문피아 작품당 3천정도 벌면 최저시급이겠다. [5] ㅇㅇ(122.254) 17:13 150 0
1114748 문피아 공모전 이래저래 말은 많았어도 상위권 작들은 ㅇㅇ(211.47) 17:12 70 0
1114747 일반 말끝에 고 <- 이거 왜 붙이는거임? [18] ㅇㅇ갤로그로 이동합니다. 17:06 242 0
1114746 일반 독자 댓글 땜에 영감 받음 [8] ㅇㅇ(106.101) 17:06 109 0
1114745 일반 선협 선배님들 질문있음 ㅇㅇ갤로그로 이동합니다. 17:05 37 0
1114744 일반 방금 생각난 소재인데 [2] ㅇㅇ(124.61) 17:03 82 0
1114743 문피아 망생이도 쉽게 투베가는 치트키 알려줌 [7] ㅇㅇ갤로그로 이동합니다. 17:02 187 0
1114742 문피아 공모전 수상 각 이제 나왔지? [1] ㅇㅇ(116.39) 16:59 95 0
1114741 문피아 인증조회수 괴담 [9] ㅇㅇ(211.185) 16:58 172 0
1114740 일반 밸런스게임 (쌩신인 vs 기성입문 vs 중고기성) [6] ㅇㅇ(1.243) 16:56 122 0
1114739 일반 한 작품에 차원이동 없이 여러 장르가 섞여 있으면 [2] ㅇㅇ(124.61) 16:56 51 0
1114738 노벨피 주인공을 [3] ㅇㅇ(222.96) 16:50 89 0
1114737 일반 근데 작가들도 뽕 차는 부분 쓰면서 [6] ㅇㅇ(124.61) 16:49 166 0
1114736 문피아 망생이 필력 늘릴라면 어떻게 해야하냐? [6] ㅇㅇ(220.127) 16:48 136 0
1114735 문피아 소재 추천 좀 [2] ㅇㅇ(116.39) 16:47 55 0
1114734 노벨피 영혼을 갈아쓰니 추천이 늘기 시작함 [2] ㅇㅇ갤로그로 이동합니다. 16:45 114 0
1114733 일반 실력 있는 사람은 고뇌없이 술술 쓰면서 1빡 2시간 컷 가능해? [5] ㅇㅇ(211.245) 16:45 107 0
1114731 노벨피 근데 갤에 노피아글 올라오는 거 보면 [5] ㅇㅇ(14.192) 16:39 145 0
1114729 일반 웹소 작가 문체가 가볍지 않은 경우에는 [4] ㅇㅇ(116.46) 16:36 195 0
1114728 일반 집>편의점>집 서술한건데 감평좀 [9] ㅇㅇ(121.164) 16:33 157 3
1114727 일반 님들 정연 붙기 vs 1500 전환 하기 [7] ㅇㅇ(202.165) 16:27 194 0
1114726 문피아 공모전은 끝날 때까지 다른 매니지 컨택 안오는거였냐... ㅇㅇ갤로그로 이동합니다. 16:21 88 0
1114725 일반 글쓰기 존나편한 프로그램 찾아버렸다... [11] ㅇㅇ갤로그로 이동합니다. 16:20 245 0
1114724 문피아 8화만에 투베 들고 [4] ㅇㅇ(14.49) 16:20 165 0
1114723 시리즈 썸머 50% 블프 플모는 효과 어떤가요? ㅇㅇ갤로그로 이동합니다. 16:18 61 0
1114722 일반 이세계 판타지물 쓰려는데 [5] ㅇㅇ(119.70) 16:18 99 0
1114721 문피아 나도낭만 뽕 지리는 판타지 이런 거 써보고 싶음 [3] 2빡맨갤로그로 이동합니다. 16:17 109 0
1114719 문피아 문매 배너 달라고 해야 줌? [6] ㅇㅇ(1.216) 16:02 186 0
1114718 노벨피 어제 오늘 조회수가 영 아니네 [1] ㅇㅇ(211.119) 15:59 70 0
1114717 문피아 문피아 선배 뜻 [3] ㅇㅇ(121.161) 15:53 217 0
뉴스 '아이쇼핑' 염정아 vs 원진아, 완벽한 설계자와 생존자의 팽팽한 대립! 파격 소재 담긴 독보적인 콘셉트! ‘아이쇼핑’만의 차별화된 핵심 포인트 집중 조명 디시트렌드 07.11
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2