현재 위치 - 회사기업대전 - 같은 도시에서 셋방을 얻다 - 데이터 시각화 교육은 어떻게 요약되나요?

데이터 시각화 교육은 어떻게 요약되나요?

데이터 시각화 훈련 요약

요약은 일이나 공부, 생각의 특정 단계에서 경험이나 상황을 분석하고 연구하는 서면 자료를 찾을 수 있게 해준다. 시간이 지나면 실수도 하고 고치고, 함께 꼼꼼히 요약을 써보자. 동일하지 않도록 요약을 작성하는 방법은 무엇입니까? 다음은 제가 꼼꼼히 정리한 데이터 시각화 교육을 요약한 내용입니다. 모두에게 도움이 되었으면 좋겠습니다.

데이터 시각화 교육 요약 1

데이터 시각화란 데이터 간의 관계를 차트를 이용해 시각적으로 표현하는 것을 말합니다. 데이터 시각화를 통해 수많은 데이터 세트를 데이터 이미지로 구성하고, 데이터의 각 속성 값을 다차원 데이터 형태로 표현하여 데이터를 다양한 차원에서 관찰할 수 있어 보다 심층적인 관찰과 분석이 가능합니다. 데이터.

1. 데이터 분석 시각화를 위해 일반적으로 사용되는 차트 유형은 다음과 같습니다.

1. 테이블

2. 산점도

3 . 꺾은선형 차트

4. 세로 막대형 차트

5. 막대형 차트

2. 시각적 분석

2.1 구매 수량을 분석하고 싶습니다. 상위 10명의 사용자는 단골 고객인가요, 아니면 주문량이 많은가요?

이 분석에는 테이블 분석을 사용하십시오. 구매 수량 기준으로 순위가 매겨진 사용자는 구매 날짜 수를 기준으로 분석됩니다. 이들은 모두 일회성 구매이며 반복 고객을 유지하는 방법을 찾아야 합니다. 이러한 대규모 고객 그룹.

2.2 2.1의 분석결과를 토대로 재방문고객의 구매강도는 어느 정도인가? 따라서 구매 후 날짜를 다시 계산하여 가장 많이 구매한 사용자를 분석했습니다. *** 분석에서 사용자는 29,944명으로 나타났으며, 그 중 재구매자는 25명에 불과하여 그 중 0.083%를 차지했습니다. 1명의 사용자만 4번 구매했고, 나머지 24명의 사용자는 2번만 구매했습니다. 판매자는 반복 고객을 유치하고 품질이 허용 가능한지 또는 활동이 충분히 강력하지 않은지 고려해야 합니다.

원형 차트를 사용하면 소수의 재구매 고객을 더 직접적으로 확인할 수 있습니다.

2.3 제품 카테고리 cat_id를 기준으로 제품 카테고리의 상위 10개 매출에 대한 통계, 막대 차트를 사용하여 시각적 분석 :

2.4 20xx년과 20xx년의 총 판매량을 각각 월별, 분기별로 선형 차트로 시각적 분석합니다. 11월이 가장 많고, 4분기 판매량도 가장 높다.

2.5 <표 2>의 데이터를 분석해 보면 어느 연령대의 아동복 매출이 높은지 알고 싶다. 시각적인 차트분석은 아래 그림과 같이 막대그래프와 산점도를 사용하였습니다. (점형그래프가 조금 더 나은 느낌입니다.) 동년배대 남학생과 여학생의 매출추이가 일관되고, 매출도 꾸준한 것을 알 수 있습니다. 연령이 높아질수록 거래량은 감소하는 경향을 보인다.

3세를 무대로 하면 0~3세 유아기에 판매량이 가장 많고, 타오바오와 티몰에 대한 시장 수요도 크다.

3. 데이터 분석의 책임으로서의 아이디어 요약

다음은 데이터 분석 학습에 대한 두 가지 예비 경험입니다. 데이터 분석은 먼저 일반적으로 사용되는 데이터 분석 방법과 데이터 분석 도구를 마스터해야 합니다. . 회사 제품에 따라 조정하고 유연하게 결합하세요. 다음으로는 데이터 분석 지식을 체계적으로 배워보고 싶다. 데이터 분석가는 실무적인 직위로 마스터가 되기 위해서는 실제 프로젝트에 대한 지속적인 교육이 필요한 직업입니다.

데이터 분석가로서 사용자 이탈 예측, 사용자 자동 분류 등 비즈니스 데이터를 데이터 사용자와 의사결정자에게 명확하고 정확하고 명확하게 제시하는 것이 주된 임무라고 생각합니다. 당신이 제공할 수 있는 가치는 훌륭합니다. 의사결정자와 관리자는 제시된 데이터 결과를 기반으로 비즈니스 활동을 적시에 합리적으로 조정하여 기업 이익을 극대화할 수 있습니다. 데이터 시각화 교육 요약 2

1. 데이터 시각화의 정의

데이터 시각화(데이터 시각화)에는 정보 기술, 자연 과학, 통계 분석, 그래픽, 상호 작용 및 지리 정보가 포함됩니다. 다양한 학제간 분야에서 숫자가 아닌 정보를 시각화하여 추상적이거나 복잡한 개념이나 정보를 표현하는 기술입니다. 간단히 말해서, 이 기술은 정보를 전달하기 위해 데이터를 차트 형태로 제시합니다.

인간은 오감을 가지고 있고 다섯 가지 채널을 통해 물질 세계를 경험할 수 있는데 왜 정보를 전달하기 위해 시각적인 방법만 선호하는 걸까요? 인간이 시각을 통해 얻는 정보의 양은 엄청나기 때문이다. 인간의 눈은 뇌와 결합해 엄청난 양의 시각 신호를 입력하는 고대역폭 병렬 프로세서를 형성하고 그 기능의 50% 이상을 갖고 있다. 뇌에서는 많은 양의 시각적 정보가 잠재의식 단계에서 처리됩니다. 인간은 텍스트보다 이미지를 60,000배 빠르게 처리할 수 있으므로 데이터 시각화는 고대역폭의 정보 전달 방식입니다.

우리의 비전이 더 넓다면, 데이터 시각화에는 크게 과학적 시각화(과학적 시각화), 정보 시각화(정보 시각화), 시각적 분석(시각적 분석)의 세 가지 분야가 있습니다. 과학적 시각화는 3차원 현상의 시각화에 초점을 맞춘 학제간 연구 및 응용 분야입니다. 건축, 기상학, 의학 또는 생물학의 다양한 시스템에서 널리 사용됩니다. 이 분야에서 연구되는 데이터는 자연적인 기하학적 구조(예: 자기) 감지 라인, 유체 분포 등).

Scientific_data_viz. png

정보 시각화는 인간의 인지 능력을 향상시키기 위해 추상적 데이터의 대화형 시각적 표현을 연구합니다. 추상 데이터에는 지리 정보, 텍스트 등 숫자 및 비숫자 데이터가 포함됩니다. 이 분야에서 연구되는 데이터는 막대 차트, 추세 차트, 흐름 차트, 트리 다이어그램과 같은 추상 구조를 가지고 있습니다. 종종 데이터 패널 형태로 반영됩니다.

info_data_viz. png

시각적 분석은 대화형 시각적 표현과 기본 분석 프로세스(통계 프로세스, 데이터 마이닝 기술)를 결합하여 높은 수준의 복잡한 활동(추론, 의사 결정)을 수행합니다.

즉, 분석. png

2. 데이터 과학의 전체 과정에서의 위치

데이터 과학의 주요 구성 요소는 데이터 정렬, 탐색적 데이터 분석 및 데이터 시각화의 세 가지 주요 단계로 구성됩니다. 더 높은 관점에서 볼 때 데이터 시각화는 데이터 과학에서 상대적으로 낮은 수준이며 최종 결과 표시 단계에 속합니다. 처음부터 시작하려면 먼저 데이터 정렬 단계에서 우리의 주요 작업은 일련의 원본 데이터 정리 및 처리를 포함하여 데이터 수집 및 분석입니다. 이 지식 영역은 주로 컴퓨터와 관련됩니다. 과학. 그 다음에는 탐색적 데이터 분석 단계가 진행되는데, 이 단계에서는 통계 및 데이터 마이닝에 대한 전문 지식을 광범위하게 활용해야 합니다. 또한 데이터를 설명하고 탐색하기 위한 차트 그리기도 필요합니다. 이 단계의 주요 작업은 필터링과 마이닝입니다. 하지만 이 단계의 시각적 분석은 데이터가 전달하려는 내용인 사용자와 데이터 간의 "대화"일 뿐인 반면, 데이터 시각화는 데이터와 독자 간의 대화, 데이터를 통해 독자에게 전달하려는 내용, 이것이 그들 사이의 가장 큰 차이점입니다. 위의 두 단계를 완료한 후 최종 데이터 시각화 단계에 도달했습니다. 이는 그래픽 디자인, 정보 시각화 및 인간-컴퓨터 상호 작용을 포함하는 다학제 분야입니다. 독자들과 소통합니다. 그러나 데이터 과학의 이 세 단계를 엄격한 순서로 진행되는 "선형" 모델로 이해하는 것은 실수입니다. 다음 단계를 통해 이전에 수행한 작업을 더 잘 이해할 수 있습니다. 아마도 데이터 시각화 단계에 도달하면 이전 단계로 돌아가서 다시 알아내야 할 의심이 너무 많다는 것을 깨닫게 될 것입니다. -마침내 최종 결과를 얻기 위해 계속해서 뒤집는 화가처럼 이전 작업을 수행하십시오. 마치 걸작을 완성하는 것처럼 데이터 시각화 과정은 갓 구운 데이터 분석 케이크에 장식을 추가하는 것이 아니라 반복적인 반복과 지속적인 최적화의 과정입니다.

3. 데이터 시각화의 기술 스택

데이터 시각화는 전형적인 다학문 분야입니다. 데이터 시각화에 필요한 지식은 데이터 과학이 엄청나다고 할 수 있습니다. 지식 체계의 스케치. 데이터 과학의 이성적인 측면과 감성적인 측면도 함께 느끼실 수 있습니다. 이 광대한 분야를 탐구하고, 항상 배우고, 끝없는 즐거움을 누리며 평생을 보낼 수 있습니다.

4. 데이터 시각화 프로세스

데이터 시각화의 본질은 비즈니스에 대한 완전한 이해를 바탕으로 데이터에 대한 심층적인 분석과 마이닝을 수행하고, 그 정보를 활용하여 데이터를 탐색하여 얻은 지식을 시각적 형태로 표시합니다. 즉, 우리가 하는 작업은 실제로 데이터 공간에서 그래픽 공간으로 매핑하는 것입니다. 우리가 해야 할 첫 번째 단계는 비즈니스와 연계된 데이터를 완전히 이해한 다음 특정 방법을 사용하여 적절한 차트 유형을 선택하는 것입니다. 이를 위해서는 차트 유형에 대한 비교적 포괄적인 이해가 필요합니다. 차트만 그리면 끝인가요? 설마. 또한 차트를 최적화해야 하는데, 최적화 대상은 다양한 차트 요소입니다. 이를 위한 일련의 지식을 아래에서 단계별로 소개하겠습니다.

4.1 비즈니스 이해와 데이터 결합

비즈니스에 대한 이해 없이 데이터 분석에 대해 이야기하는 것은 어리석은 일입니다. 여기서는 데이터와 비즈니스를 빠르게 이해하여 추가 탐색 및 분석을 수행할 수 있는 방법인 '5W2H 방법'을 소개합니다.

1단계: 이게 무슨 사업인가요? 데이터는 어떤 비즈니스 주제를 설명합니까?

2단계: HOW, 즉 데이터를 수집하는 방법은 무엇입니까? 수집 규칙은 후속 분석에 영향을 미칩니다. 예를 들어 백엔드 데이터 매장지인 경우 데이터는 일반적으로 실시간이며 프런트엔드 데이터 매장지인 경우 아래에서 추가로 명확히 할 필요가 있습니다. 데이터가 업로드되는 네트워크 상태는 무엇입니까? 네트워크가 없을 때 어떻게 처리하나요? 이는 최종 데이터의 품질과 분석 품질에 영향을 미칩니다.

3단계: 왜, 이 데이터가 수집되는 이유는 무엇입니까? 우리는 데이터에서 무엇을 알고 싶은가? 데이터 분석의 목표는 무엇인가?

4단계: 언제, 어떤 기간의 비즈니스 데이터인가요?

5단계: 지리적 범위의 비즈니스 데이터는 어디에 있습니까?

6단계: 누가, 누가 데이터를 수집했나요? 기업 내에서는 그것이 어떤 비즈니스 시스템에서 비롯되는지에 더 많은 관심을 기울일 수 있습니다.

7단계: 다양한 데이터의 양과 크기는 얼마이며, 분석을 뒷받침하기에 충분합니까? 데이터가 충분할 때와 불충분할 때 분석 방법이 다릅니다. 7개 질문 중 하나에 대한 응답이 만족스럽지 못한 경우 이는 이 영역에 개선의 여지가 있음을 나타냅니다.

4.2 차트 유형 선택

간단한 세 단계를 통해 적절한 차트 유형을 선택할 수 있습니다. 첫째, 데이터 유형을 확인하고, 둘째, 데이터 차원을 확인하고, 셋째, 표현되는 내용을 살펴보세요.

두 가지 데이터 유형이 있고 각 데이터 유형에는 두 개의 하위 범주가 있습니다. 첫째, 범주형 및 정량적 데이터가 있습니다. 범주형 데이터는 분류라고 하는 과일의 네 가지 범주인 사과, 바나나, 배, 포도와 같은 범주를 나타내는 데 사용됩니다. 예를 들어 레드 와인의 품질은 낮은 것으로 나눌 수 있습니다. , 중간, 높음 세 가지 수준으로 구성된 사람의 신체에는 날씬함, 정상, 비만 등이 포함됩니다. 이 특별한 범주형 변수를 범주형 순서화라고 합니다. 정량적 데이터는 두 가지 범주로 더 나눌 수 있습니다. 하나는 사람의 나이와 같은 연속 값 데이터이고, 다른 하나는 고양이 수와 같은 이산 값 데이터라고 합니다.

copyright 2024회사기업대전