총결산은 일, 학습 또는 사상의 한 단계에 대한 경험이나 상황을 분석하고 연구하는 서면 자료이다. 그것은 우리가 제때에 잘못을 발견하고 바로잡을 수 있게 해준다. 모두 함께 총결산을 열심히 쓰자. 어떻게 총결산을 써야 천편일률적이지 않을까요? 다음은 제가 세심하게 정리한 데이터 시각화 교육 요약입니다. 참고용으로만, 당신에게 도움이 되기를 바랍니다.
데이터 시각화 교육 요약 1 데이터 시각화는 차트를 통해 데이터 간의 관계를 시각적으로 보여주는 것을 의미합니다. 데이터 시각화를 통해 대량의 데이터 세트를 데이터 이미지로 형성하고 데이터의 모든 속성 값을 다차원 데이터로 표현하여 다른 차원에서 데이터를 관찰하여 데이터를 보다 깊이 관찰하고 분석할 수 있습니다.
첫째, 데이터 분석 시각화에 일반적으로 사용되는 차트 유형은 다음과 같습니다.
1, 표
2. 분산형 차트
3. 라인 차트
4. 히스토그램
5. 막대 차트
둘째, 시각적 분석
2. 1 사전 10 을 분석하고자 하는 사용자가 루프백 고객입니까, 아니면 많은 고객이 있습니까?
이 분석은 양식 분석을 사용하여 구매 횟수에 따라 전 10 사용자를 분석합니다. 모두 일회성 구매이며, 재귀객이 아닙니다. 기업은 이러한 큰 고객층을 유지할 방법을 강구해야 합니다.
2.2 2. 1 분석 결과에 따르면, 그 귀환객들의 구매력은 어떻습니까? 이에 따라 구매일을 다시 한 번 집계해 구매횟수가 많은 사용자를 분석했다. 이번 * * * 분석에는 29944 명, 귀환객은 25 명, 비율은 0.083% 에 불과했다. 1 사용자만 네 번, 나머지 24 명의 사용자는 두 번만 샀습니다. 상가는 품질이 표준에 부합하는지, 활동력이 부족한지 등을 고려하여 일부 귀환객을 끌어들여야 한다.
원형 차트로 직접 돌아보면 환객의 비율이 작다.
2.3 상품 범주 cat_id 를 기준으로 사전 10 판매 범주를 집계하여 막대 차트를 사용하여 시각적으로 분석합니다.
2.4 월별 및 분기별로 20xx 및 20xx 의 총 매출을 시각적으로 분석하여 다음과 같은 매출 변화 추세를 명확하게 볼 수 있습니다. 1 1 월 판매량이 가장 높고 4 분기 판매량이 가장 높습니다.
2.5 표 2 의 데이터를 분석하여 어느 연령대의 아동복 판매량이 높은지 알고 싶습니까? 아래와 같이 각각 막대 그래프와 산포 그래프를 이용한 직관적인 차트 분석 (점 효과가 약간 좋음) 을 통해 같은 연령대의 남녀 학생들의 판매 추세가 일치하고 매출이 연령에 따라 감소하는 추세를 알 수 있다.
3 세를 한 단계로 하면 0 ~ 3 세가 유아기 판매량이 가장 높고 타오바오와 티몰 시장의 수요가 크다.
셋째, 데이터 분석 책임의 요약으로서
이 글에서는 데이터 분석에 대한 두 가지 예비 연구 경험을 요약했습니다. 데이터 분석은 먼저 일반적인 데이터 분석 방법과 도구를 파악한 다음 당사 제품에 따라 조정하고 유연하게 조합해야 합니다. 다음으로, 나는 체계적인 학습 데이터 분석 지식을 원한다. 데이터 분석가는 실천성이 강한 직책으로, 실제 종목에서 끊임없이 훈련을 해야 고수가 될 수 있다.
데이터 분석가로서 저는 비즈니스 데이터를 명확하고 정확하며 명확하게 데이터 사용자 손실 예측 및 사용자 자동 분류와 같은 의사 결정자에게 제공하는 것이 제 주된 임무라고 생각합니다. 네가 제공할 수 있는 것은 매우 가치가 있다. 의사결정자와 관리자는 제시된 데이터 결과에 따라 적시에 합리적으로 경영 활동을 조정하여 기업 이윤을 극대화할 수 있습니다.
데이터 시각화 교육 요약 2 i. 데이터 시각화의 정의
데이터 시각화는 정보 기술, 자연 과학, 통계 분석, 그래픽, 상호 작용, 지리 정보 등 다학과 교차 분야를 포괄하는 기술로, 비디지털 정보를 시각화하여 추상적이거나 복잡한 개념과 정보를 표현합니다. 간단히 말해서, 이 기술은 데이터를 그래프로 표현하고 정보를 전달한다. 인간은 다섯 가지 감각을 가지고 있으며, 다섯 가지 경로를 통해 물질 세계를 느낄 수 있습니다. 그렇다면 왜 시각화만을 선호하여 정보를 전달해야 합니까? 인간의 시각에서 얻는 정보의 양이 엄청나기 때문이다. 인간의 눈은 뇌를 결합하여 거대한 시각 신호 입력을 구성하는 고대역폭 병렬 프로세서로, 뛰어난 패턴 인식 기능을 갖추고 있다. 뇌의 50% 이상이 시각 인식 관련 처리에 사용되고, 대량의 시각 정보는 잠재 의식 단계에서 처리된다. 인체 이미지는 텍스트보다 6 만 배 빠르게 처리되므로 데이터 시각화는 고대역폭 정보 교환 방식입니다.
시야를 넓히면 데이터 시각화에는 과학 시각화, 정보 시각화 및 시각화 분석의 세 가지 분기가 포함됩니다. 과학 시각화는 학제 간 연구 및 응용 분야로, 주로 3 차원 현상의 시각화를 연구하여 건축, 기상, 의학 또는 생물학의 다양한 시스템에 광범위하게 응용한다. 이 분야에서 연구한 데이터는 자연 형상 구조 (예: 자기 감지 선 및 유체 분포) 를 가지고 있습니다.
과학 데이터. png
정보 시각화는 추상적 데이터의 대화식 시각적 표현을 연구하여 인간의 인식을 강화한다. 추상 데이터에는 지리 정보 및 텍스트와 같은 숫자와 숫자가 아닌 데이터가 포함됩니다. 이 분야에서 연구한 데이터는 모두 히스토그램, 추세 차트, 흐름도, 트리 차트 등과 같은 추상적인 구조를 가지고 있다. 이러한 차트는 추상적인 개념을 시각적 정보로 변환하는데, 이 정보는 일반적으로 데이터 패널로 표현됩니다.
정보 _ 데이터 _viz .png
시각화 분석은 대화식 시각화 표현과 기본 분석 프로세스 (통계 프로세스 및 데이터 마이닝 기술) 를 결합하여 고급 및 복잡한 활동 (추론 및 의사 결정) 을 수행합니다.
즉 _ analysis.png 입니다
둘째, 전체 데이터 과학 과정에서의 지위
데이터 과학의 주요 구성 요소는 데이터 정리, 탐색 데이터 분석 및 데이터 시각화의 세 가지 주요 단계로 구성됩니다. 더 높은 위치에서 데이터 시각화는 데이터 과학에서의 지위가 상대적으로 뒤떨어져 결과 전시의 마지막 단계에 속한다. 처음부터 시작하려면 먼저 데이터 처리 단계에서 원본 데이터의 일련의 정리 및 처리를 포함하여 데이터를 수집하고 분석하는 것이 우리의 주요 임무입니다. 이 지식 분야는 주로 컴퓨터 과학과 관련이 있다. 둘째, 탐색 데이터 분석 단계, 많은 통계 및 데이터 마이닝 전문 지식 필요, 그리고 데이터를 설명 하 고 탐구 하는 차트를 그릴 필요가 있다. 이 단계의 주요 임무는 필터링과 발굴이다. 그러나 이 단계의 시각화 분석은 너와 데이터 사이의' 대화' 일 뿐, 데이터가 너에게 알려주고 싶은 것이고, 데이터 시각화는 데이터와 너의 독자 사이의 대화이며, 네가 데이터를 통해 독자에게 알려주고 싶은 것이다. 이것이 가장 큰 차이다. 위 두 단계의 내용을 완성한 후, 그래픽 디자인, 정보 시각화, 인간-컴퓨터 상호 작용을 포함하는 다학과 분야인 우리의 마지막 데이터 시각화 단계입니다. 우리의 주요 임무는 정보를 정제한 다음 시각적으로 표현하고 독자와 상호 작용하는 것이다. 그러나 데이터 과학의 이 세 단계를 엄격한 순서의' 선형' 모델로 이해한다면, 그것은 완전히 틀렸다. 반복의 비선형 과정이다. (알버트 아인슈타인, 과학명언) 다음 단계는 이전에 한 일에 대해 더 많이 알게 해 줄 것이다. 데이터 시각화의 단계에 이르렀을 때, 당신은 아직 너무 많은 의문점이 있다는 것을 깨닫게 될 것이다. (윌리엄 셰익스피어, 템페스트, 데이터명언) 우리는 이전 단계로 돌아가 이전 일을 다시 해야 한다. 마치 화가가 몸을 뒤척이며 결국 걸작을 완성하는 것과 같다. 데이터 시각화의 과정은 갓 구운 데이터 분석 케이크에 금상첨화를 주는 것이 아니라 반복적이고 끊임없이 최적화하는 과정이다.
셋째, 데이터 시각화의 기술 스택
데이터 시각화는 전형적인 학제 간 영역입니다. 데이터 시각화에 필요한 지식은 데이터 과학의 방대한 지식 체계의 실루엣이라고 할 수 있다. 데이터의 과학적 합리성을 느낄 수 있습니다. 한편으로는 그녀의 감성적인 면도 느낄 수 있다. 평생 동안 이 광활한 분야를 탐험할 수 있고, 늘 새로운 것을 배우고 즐거워할 수 있다. (윌리엄 셰익스피어, 햄릿, 인생명언)
넷째, 데이터 시각화 프로세스
데이터 시각화의 본질은 비즈니스에 대한 완전한 이해를 바탕으로 데이터에 대한 심층적 인 분석과 마이닝을 수행 한 다음 데이터를 탐색하여 얻은 정보와 지식을 시각화하는 것입니다. 즉, 우리가 하는 일은 실제로 데이터 공간에서 그래픽 공간으로의 매핑입니다. 우리가해야 할 첫 번째 단계는 비즈니스와 결합하여 데이터를 완전히 이해하고 몇 가지 방법으로 적절한 차트 유형을 선택하는 것입니다. 이를 위해서는 먼저 차트 유형에 대한 포괄적 인 이해가 필요합니다. 차트를 다 그리면 끝나나요? 사실 그렇지 않습니다. 우리는 또한 다양한 차트 요소에 대한 차트를 최적화해야 한다. 우리는 이것에 대해 일련의 디자인 기교를 가지고 있으며, 다음은 점진적으로 소개할 것이다.
4. 1 비즈니스 이해 데이터 결합
업무를 모르면서 데이터 분석에 대해 이야기하는 것은 건달이다. 이 문서에서는 "5W2H 법" 이라는 추가 탐색 및 분석을 위해 데이터와 비즈니스를 빠르게 이해하는 방법에 대해 설명합니다.
첫 번째 단계: 뭐, 무슨 일이야? 데이터 설명의 비즈니스 주제는 무엇입니까?
두 번째 단계: 방법, 즉 데이터를 수집하는 방법? 수집 규칙은 후속 분석에 영향을 줄 수 있습니다. 예를 들어, 백엔드 데이터 포함 지점인 경우 데이터는 일반적으로 실시간입니다. 프런트 엔드 데이터 임베딩 포인트인 경우 데이터가 어떤 네트워크 상태에서 업로드되는지 더 잘 이해해야 합니다. 인터넷이 없을 때 어떻게 해야 하나요? 이들은 최종 데이터의 품질에 영향을 주고 분석의 품질에 영향을 줍니다.
3 단계: 왜, 왜 이 데이터를 수집해야 합니까? 우리는 데이터로부터 무엇을 배우고 싶습니까? 데이터 분석의 목표는 무엇입니까?
4 단계: 언제, 언제 비즈니스 데이터가 세분화되고 있습니까?
5 단계: 어디에, 비즈니스 데이터는 어디에 있습니까?
6 단계: 세계보건기구, 누가 수집한 데이터? 기업에서, 아마도 어느 비즈니스 시스템에서 왔는지에 더 관심이 있을 것이다.
7 단계: 얼마나 많은 데이터가 분석을 지원합니까? 자료가 충분하고 부족한 상황에서 분석 방법은 다르다. 만약 7 개 문제 중 한 가지 질문에 대한 답이 만족스럽지 않다면, 개선의 여지가 있다는 것을 설명한다.
4.2 차트 유형 선택
데이터 유형 보기, 데이터 차원 보기, 표현할 내용 보기 등 세 가지 간단한 단계를 통해 적절한 차트 유형을 선택할 수 있습니다.
각각 두 개의 하위 범주가 있는 두 가지 데이터 유형이 있습니다. 첫째, 분류 데이터와 정량 데이터가 있습니다. 분류 데이터는 사과, 바나나, 배, 포도와 같은 범주를 나타내는 데 사용됩니다. 이것은 분류 및 분류라고 하는 과일의 네 가지 범주입니다. 일부 분류 변수는 순서가 있다. 예를 들면 와인의 품질은 낮음, 중, 고 3 등급으로 나눌 수 있고, 사람의 체형은 날씬하고 정상적이며 비만이다. 이 특별한 분류 변수를 분류 정렬이라고 합니다. 정량 데이터는 사람의 나이와 같은 연속 가치 데이터라는 두 가지 범주로 더 나눌 수 있습니다. 고양이 수와 같은 이산값 데이터라고 합니다.