한 브랜드는 샤오홍슈 안에서 매트릭스 수를 만들었고, 운영팀에는 전담 데이터 분석가가 있었다. 샤오홍슈 데이터 분석을 어떻게 해야 할지 몰라서 문의를 했다. 데이터 분석의 역할은 제품 운영 및 마케팅 업무에서 매우 중요합니다. 그룹 각 부서의 리더십 결정에 대한 중요한 근거일 뿐만 아니라 마케팅 운영 리더가 비즈니스 돌파구를 찾는 중요한 방법이기도 합니다. 일반 10 명 이상의 팀에는 데이터 분석가 보조 업무 1 명이 배정됩니다. 10 보다 작은 팀은 데이터 분석을 아는 운영자가 겸임할 수 있다. 데이터 분석 3 영역 데이터 분석 3 영역: 1 단계, 데이터 수집, 데이터 정리, 데이터 에스컬레이션 2 층, 데이터 처리, 문제 발견, 문제 제기. 3 층, 데이터 분석을 통해 통찰력 발견, 의사결정에 영향을 미침. 1 층의 데이터 분석가는 매일 아침 첫 번째 일은 데이터를 가져오는 것이다. 회사에 데이터베이스가 있지만 시각화 검색 도구가 없는 경우 SQL 문을 작성하여 서버에서 데이터를 가져옵니다. 데이터를 가져오는 데 몇 시간이 걸릴 수 있습니다. 회사에 데이터베이스가 있고 시각화 검색 도구가 있는 경우 데이터베이스에서 필요에 따라 원하는 데이터를 계산한 다음 복사하여 excel 테이블에 붙여 넣습니다. 지도자가 필요로 하는 데이터를 얻은 후, 데이터를 정리해서 표나 PPT 에 넣어 지도자가 참고할 수 있도록 하는 것이다. 매일 새로운 데이터가 있기 때문에 이러한 데이터 분석가는 매일 작업을 반복해야 합니다. 그런 다음 지도자가 업스트림의 요구를 충족시킬 때 데이터를 처리하는 더 많은 임무가 있을 것이다. (윌리엄 셰익스피어, 윈스턴, 자신감명언) 이러한 데이터 분석가의 가치는 데이터를 수집하고 정리하여 리더십과 동료의 시간을 절약하는 데 있습니다. 하지만 동시에 이 값은 쉽게 대체될 수 있어 초과 근무, 수속, 바로 가기 기술, 철자가 꼼꼼하다. 미친 초과 근무, 불평할 엄두가 나지 않는다. 2 층 데이터 분석가는 데이터를 처리하여 지도자가 중요한 데이터를 쉽게 보고 많은 데이터에서 문제를 찾아내 리더십의 의사결정을 보조할 수 있도록 합니다. 예를 들어, 리더는 한 제품의 판매량과 같은 데이터의 추세 변화를 보는 것을 선호하지만, 1 급 데이터 분석가는 매일 판매 데이터시트만 제공합니다. 계층 2 의 데이터 분석가는 PowerBI 와 같은 도구를 사용하여 데이터 추세 차트를 생성할 수 있으므로 리더는 최근의 데이터 변경 사항과 전략 조정이 필요한지 여부를 매일 명확하게 확인할 수 있습니다. 만약 네가 이 정도까지 할 수 있다면, 훌륭한 조수, 의사 결정의 유능한 조수라고 할 수 있다. 세 번째 계층은 세 번째 계층의 데이터 분석가로, 데이터 더미에서 문제를 발견하고, 문제를 분석하고, 문제 해결 전략을 설계하는 데 능숙합니다. 한 슈퍼마켓이 데이터 분석을 통해 맥주와 기저귀를 함께 넣으면 아기가 있는 아버지가 둘 다 살 수 있기 때문에 매출이 크게 늘어난다는 전설이 있다. 전설이지만 데이터 분석을 통해 마케팅 통찰을 발견해 해당 전략을 제시해 뚜렷한 효과를 얻을 수 있다는 뜻이다. 앞으로 시간이 날 때, 나는 내가 어떻게 데이터 분석을 통해 의사 결정을 내릴 수 있는지를 설명하는 문장 한 편을 쓸 것이다. 이렇게 하면 우수한 성적을 얻을 수 있다. (존 F. 케네디, 공부명언) 둘째, 데이터 분석의 프로세스 데이터 분석의 기본 6 단계: 1, 분석의 목적을 제시하는 이 단계는 많은 회사에서 사장이 하고 사장이 임무를 데이터 분석가에게 맡긴다. 예를 들어, 오늘 사장은 최근 반년 매출의 일일 통계, 성장 추세, 구역, 점포의 성장 상황을 볼 수 있는 표를 한 장 주세요. 예를 들어 그저께 사장이 말했다. "우리 제품을 좀 봐 주세요. 어떤 양두 조합이 더 적절해요." 예를 들어, 지난주 사장은 최근 판매 수치가 좀 엉성하다고 말했다. 왜 그런지 알아봐 주세요. 그러나 순위가 높은 데이터 분석가는 자신의 분석 목적을 찾을 수 있습니다. 예를 들어, 어떤 전략을 설계하여 비즈니스의 매출을 늘릴 수 있습니까? 2. 데이터 가져오기 Excel 표는 654.38+0 만 행 이내의 데이터를 처리하는 데 적합하며, 654.38+0 만 행 이내의 데이터 처리도 일반적입니다. 그래파이트 문서와 같은 수천 개의 온라인 데이터도 처리할 수 있습니다. 수만 행과 수십만 행의 데이터를 처리하려면 PowerBI 와 같은 전문적인 데이터 처리 도구가 필요합니다. 수백만 ~ 수억 행의 데이터를 처리하려면 MySQL 과 같은 데이터베이스 도구를 사용해야 하며 기본 데이터베이스 언어도 배워야 합니다. 우리에게는 샤오홍슈, Excel 양식 또는 흑연 문서의 온라인 양식과 관련된 데이터를 처리하면 충분합니다. 소량의 데이터를 수동으로 입력하는 것이 더 빠를 수 있습니다. 어떤 데이터는 좀 크거나 파충류로 비교적 편리하면 파충류로 데이터를 수집한다. 예를 들어 바이두 검색으로 찾은 결과는 파충류를 사용하는 것이 더 편리하다. 예를 들어, 많은 페이지를 뒤져도 인증 코드를 입력할 필요가 없는 웹페이지의 경우, 파충류를 사용하는 것이 계정에 로그인하지 않고 원하는 내용을 볼 수 있는 웹페이지보다 편리합니다. 파충류를 배우려면 이런 목적을 가지고 관련 파이썬 프로그래밍 언어를 배울 수 있다. Webscraper 와 같은 문어와 같은 비교적 간단한 파충류 도구도 있습니다. 샤오홍슈 관련 데이터의 경우 기본적으로 수동으로 데이터를 입력하는 것이 좋습니다. 수십만 개의 데이터가 곧 완성되었습니다. 3. 데이터 처리가 완료되면 먼저 데이터를 처리해야 합니다. 예를 들어, 데이터 형식이 정확합니까? 일부 데이터 형식은 사후 계산, 정렬 등의 작업에 불편합니다. 일부 데이터 형식은 일정하지 않을 수 있고, 일부 데이터는 누락될 수 있으며, 일부 데이터는 잘못될 수 있습니다. 이러한 문제가 후속 분석 결과에 영향을 줄 수 있는 경우 미리 처리해야 합니다. 4. 데이터를 분석합니다. 이것은 가장 사람을 시험하는 단계이다. 어떤 분석이 어떤 설득력 있는 결론을 내는지. 정확한 결론을 내리기 전에, 우리는 어떤 분석 방법을 사용해야 하는지, 어떤 분석 방법을 사용해야 할지 알 필요가 없다. 그 결과 뒤돌아보면 그렇게 간단하다고 생각할지 모르지만, 그 과정에서 그렇게 힘들었다. (윌리엄 셰익스피어, 템페스트, 희망명언) 우리가 중학교에서 수학 문제를 푸는 것처럼. 5. 데이터 시각화 분석이 완료되면 종종 시각화를 사용해야 합니다. 이해하고 명확하게 볼 수 있어야 할 뿐만 아니라 리더와 동료들이 이해하고 명확하게 볼 수 있도록 해야 합니다. 분석 결과를 보다 간단하고 직관적으로 만듭니다. 가장 간단하고 일반적인 데이터 시각화 방법은 막대 그래프, 파이 차트, 선 그래프 및 산포 그래프입니다. 6. 데이터 분석에서 실행 가능한 결론을 얻어야만 결론을 내리고, 모두의 의견을 통일하여, 모두가 그에 상응하는 행동을 취하도록 추진할 수 있다. 만약 당신이 결정을 제대로 인정하지 않고 그것을 승인하지 않는다면, 집행이 충돌할 수도 있고, 심지어는 역조를 부를 수도 있다. 따라서 데이터 분석은 데이터를 통해 여러분을 설득하여 비즈니스 발전을 촉진할 수 있는 설득의 한 방법입니다. 샤오홍슈 관련 데이터 분석에서 분석 작업은 주로 소유 계정 분석, 벤치마킹 분석, 비소유 계정 분석 등의 측면에 초점을 맞추고 있습니다. 세 가지 자신의 계정 분석은 샤오홍슈 팀의 데이터 분석가로서 자신의 계정을 분석하는 데 중점을 두고 있습니다. 하나의 계정 또는 여러 계정에 대한 책임이 있을 수 있습니다. 유지 관리할 데이터의 양은 100-2000 뿐이므로 데이터를 얻는 가장 빠른 방법은 수동으로 excel 양식에 데이터를 입력하는 것입니다. 샤오홍슈 계정의 데이터를 보는 두 가지 주요 방법이 있는데, 하나는 컴퓨터측에서 창작서비스 플랫폼에 로그인하는 것이고, 다른 하나는 창작센터의 휴대전화측에서 보는 것이기 때문이다. 컴퓨터측의 데이터 표시 차원은 더 적지만 최근 30 일 동안의 각 노트에 대한 흐름 차트를 볼 수 있습니다. 샤오홍슈 데이터는 행별로 정렬되지 않으므로 복사하여 테이블에 붙여 넣을 수 없습니다. 플랫폼에는 반등반 전략이 있어 파충류 소프트웨어로 시계를 정리하는 것은 쉽지 않다. 주요 데이터는 휴대폰에서만 볼 수 있어 더욱 번거롭다. 그래서, 솔직히, 이 데이터를 수동으로 정리하십시오. 양식을 사용하여 원시 데이터 수집, 첫 번째 양식, 각 노트에 대한 데이터 입력, 최소한 계정명, 제목, 독서량, 좋아하는, 수집, 댓글, 공유, 팬, 1 인당 시청 시간, 조회수, 조회수 평가, 5s 재생 완료율 (비디오 내용의 지표) 연령 분포 (주문형 통계 1-2 연령대 또는 전체 5 연령대), 시 분포 (주문형 통계 전 1-3 시 또는 전 10 시), 청중 관심 (주문형 통계 전) 두 번째 형식은 일일 조회수, 최근 7 일 조회수, 최근 7 일 총 관람시간, 최근 7 일 조회수, 최근 7 일 소장품 수, 최근 7 일 댓글 수, 최근 7 일 홈페이지 방문자 수, 최근 7 일 공유 노트 수, 최근 7 일 조회수 순위 백분위수 필드를 포함한 계정의 기본 데이터를 입력합니다 최근 7 일 페이지 트래픽 비율, 최근 7 일 기타 소스 트래픽, 최근 7 일 동안 팬 수 추가, 최근 7 일 동안 팬 수 손실, 여성 팬 비율, 연령 분포 비율, 도시 분포 비율, 시청자 관심 분포 비율에 주목한다. 일부 지표의 독서량을 계산하다. 검색 결과를 통해 노트를 클릭하는 독서량, 노트 검색의 독서량 = 노트 독서량 × 검색 비율. 검색 결과의 조회수를 볼 수 없기 때문에 노트를 보고 독서량을 검색해야 한다. 독서량이 높을수록 메모는 검색 결과에서 더 유리합니다. 검색 결과를 레이아웃하려면 이러한 검색 읽기가 많은 노트를 연구하여 팀의 창작 방향을 최적화해야 합니다. 노트 추천 독서량: 홈페이지를 통해 노트 추천 독서량, 노트 추천 독서량 = 노트 추천 독서량 × 홈페이지 추천 노출량: 노트 홈페이지 추천 노출, 노트 추천 노출 = 노트 읽기/조회수. 권장 값이 높으면 시스템에서 주석을 더 쉽게 식별할 수 있음을 나타냅니다. 추천량과 관련된 관련 요소를 찾아 팀 지도의 방향을 최적화할 수 있습니다. 같은 도시의 독서량: 이 노트는 같은 도시의 사용자 독서량, 같은 도시의 독서량 = 노트 독서량 × 같은 도시의 비중이다. 어떤 상인들은 동성이 매우 강하고, 동성 밖의 유량은 의미가 크지 않아, 동성의 독서량을 봐야 한다. 상호 작용률: 상호 작용률 = (점잔+컬렉션+리뷰)/독서량. 상호 작용률은 일반적으로 노트가 추천할 만한 지표인지 여부를 평가하는 지표로 간주되며, 상호 작용률이 높은 메모는 더 쉽게 추천할 수 있다. 상호 작용률이 높은 메모는 상호 작용률을 높인 경험을 총화하여 향후 노트의 성능을 높이는 데 사용될 수 있습니다. 분말 비율: 분말 비율 = 분말 수/독서량. 가루율이 높을수록 독자의 주의를 끌기 쉽다. 파우더율이 높은 주의사항은 보초를 고려할 수 있고 감자튀김도 파우더를 늘리는 것을 고려할 수 있다. 데이터 분석을 통해 더 높은 트래픽을 얻는 방법은 종종 트래픽 불안으로 이어질 수 있습니다. 왜 최근 트래픽 감소가 뚜렷한지, 왜 트래픽이 계속 올라가지 않는지. 이럴 때는 데이터 분석가가 왜 이러는지, 어떤 변화를 해야 하는지 알려줘야 한다. 유량 분포에 변화가 있는지, 주요 유량 변화가 어디에 집중되어 있는지 보세요. 이전에 계산 된 지표 중 일부에 따르면 선 차트를 생성하면 일반적으로 문제가 명확하게 나타납니다. 이는 최근 메모 권장 트래픽의 급격한 감소로 인한 경우가 많습니다. 다음으로 관심 분포, 성별 분포, 도시 분포, 조회수 등의 수치가 어떻게 변했는지 살펴보자. 필기의 해당 대상 집단이 바뀌었거나 노트 자체의 흡인력이 부족하거나 조회수가 높지 않거나 노트를 잘 쓰지 못해 상호 작용률이 낮을 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), Northern Exposure (미국 TV 드라마) 일단 원인을 찾으면 해결책을 찾을 수 있다. 데이터 분석을 통해 더 많은 매출을 얻는 방법을 지도할 수 있다. 우선 이 업무의 거래 경로를 정리해야 한다. 예를 들어, 한 의미기구의 경로는 독서 노트-홈페이지 유량-사신-위챗 사역-거래입니다. 그런 다음 모니터링: 7 일 읽기, 7 일 홈페이지 방문량, 7 일 사신, 7 일 위챗, 7 일 거래 (금액), 홈페이지 방문량, 독서량 사신율, 홈페이지 방문량 사신율, 사신플러스 위챗 비율, 7 일마다 거래율을 계산할 수 있다. 그런 다음 문제를 찾을 수 있습니다. 예를 들어, 때로는 독서량이 증가했지만 판매량이 줄어 최근 독서량에 따른 사신율이 현저히 떨어진 것을 발견하고 홈페이지에 따라 방문한 사신율이 그리 뚜렷하지 않다는 것을 알게 되었다. (윌리엄 셰익스피어, 독서, 독서, 독서, 독서, 독서, 독서, 독서, 독서, 독서) 문제는 독서량을 첫 페이지 액세스로 유도하는 데 문제가 있다는 점이다. 그런 다음 첫 페이지 액세스로 유도하는 전략을 개발해야 한다. 노트 복사에서 설명 영역으로의 안내는 반복이 필요하다. 4 대 표시 분석 대표 분석은 주로 대표 계정과 대표 내용을 분석한다. 우리는 벤치마킹 분석에 관한 특집 문장 한 편을 가지고 있다. 벤치마킹은 직접 경품일 뿐만 아니라 어떤 면에서 경쟁력 있는 계정뿐만 아니라 관심 지점, 목표그룹, 콘텐츠 스타일 등에서 일치도가 높은 계정도 포함돼 있다. 벤치마킹 분석의 주요 가치는 컨텐츠 제작 및 운영 작업 최적화에 대한 참조를 제공하는 것입니다. 전자상거래 분야에서는 경쟁 데이터 분석이 자주 이루어지지만, 콘텐츠 분야에서는 직접 경쟁자들뿐만 아니라 전문 데이터가 부족한 경우가 많습니다. 그래서 우리는 매주 기준 계좌의 데이터 분석을 하지 않고 자신의 내용에 집중하면 된다. 5. 소유되지 않은 계정 분석. 홍보를 위해 블로거를 찾아야 한다면, 이들 블로거들의 데이터를 평가해야 한다. 단순히 팬 수를 보면 큰 실수를 하기 쉽다. 좋은 데이터 분석 모델을 만들 수 있다면 블로거를 선별하고 적절한 가격을 제시하는 것이 더 쉽습니다. 광고 효과와 가장 관련성이 높은 데이터는 전환율로 여러 차례 검증을 거쳐 점차 정확해야 한다. 같은 블로거가 발표한 내용은 독서량이 같더라도 문안의 전환률이 몇 배나 다를 수 있다. 전환율 외에도 관련성이 높은 데이터는 독서량입니다. 노트의 독서량이 높을수록, 우리는 통상 더 높은 판매량을 가져올 것이라고 생각한다. 그러나 다른 유형의 콘텐츠 전환율은 실제로 몇 배, 심지어 10 배 이상 크게 다릅니다. 어떤 노트는 조회수가 높고 전환율이 낮으며, 어떤 노트는 조회수가 낮고 전환률이 높다. 두 가지 해결책이 있습니다. 첫 번째는 데이터 분석 경험의 지속적인 축적을 통해 노트를 여러 유형으로 나누고 같은 유형의 노트를 비교한 것으로, 같은 유형의 노트의 전환율은 적어도 크게 다르지 않다. 이 솔루션은 지속적인 데이터 분석과 연구가 필요합니다. 이것은 매우 어렵습니다. 두 번째는 여러 협력 사례를 통해 측정 평균 데이터를 누적하여 오차를 어느 정도 줄일 수 있고 조작이 간단하다는 것이다. 블로거가 반드시 실제 독서량을 보여 주거나 예비 심사 과정에서 독서량을 조사하는 것이 불편할 수도 있기 때문이다. (윌리엄 셰익스피어, 독서, 독서량, 독서량, 독서량, 독서량, 독서량, 독서량) 그래서 일반적으로 유행하는 전략은 통계적으로 좋아하는 것이다. 그러나 어떤 유형의 필기평가율은 10%-20% 에 이를 수 있고, 어떤 유형의 필기평가율은 0. 1% 도 안 된다. 일부 블로거들의 노트는 주로 소수의 열렬한 팬이나 서로 칭찬하는 데서 나온다. 짱 50 개 이하의 노트는 상호 짱, 짱 구매 등 행위에 의해 조작되기 쉬우므로 데이터 조작의 가능성이 있다. 그러나 이것은 예비 선별에서 중요하지 않다. 천 짱 기준에 따라 폭금을 평가하는 방식도 믿을 수 없다. 일부 1000 짱 노트, 읽기량은 1w 정도이고, 일부 10w 노트, 읽기량은 100 짱 정도입니다. 따라서 협동을 하기 전에 계정을 필터링하는 단계에서는 최소한 별명, 팬, 총 짱 수, 댓글, 댓글 짱 수, 최신 10 문장 또는 최근 2 개월 동안의 평균 짱 수, 최근 2 개월 동안 가장 낮은 짱 수, 30% 등급 작품의 짱 수, 30% 등급 작품의 수 등의 데이터를 집계해야 한다 최소 짱 팬 으로부터 트래픽을 추정 하는 데 사용 됩니다. 시스템에 거의 추천되지 않을 때 작품에 대한 호평은 불황 상태에 처해 있으며, 이 때의 호평은 거의 팬들로부터 나온다. 30% 의 작품 포인트 수는 당신의 출시가 어떤 낙관적인 결과를 얻을 수 있는지를 예측하는 데 사용될 수 있다. 기본 예측 공식은 다음과 같이 참조한 다음 실제 데이터를 기준으로 최적화를 조정할 수 있습니다. 예상 읽기 = 예상 짱 /3% 예상 판매 = 예상 읽기 × 예상 전환율 (1%) 예상 출력 = 예상 판매 × 판매 가격, 이렇게 하면 이 블로거가 가져온 예상 출력을 미리 추정하여 최대 광고비 수를 결정할 수 있습니다. 실제 경험에 따라 예상 생산량을 반복적으로 계산하는 것이 좋습니다. 초기 데이터는 데이터가 부족한 경우에만 참고할 수 있습니다. 선행 건의는 먼저 보수적인 추정, 즉 예상 생산량이 5- 10 배 감소할 것을 제안한다.