현재 위치 - 회사기업대전 - 기업 정보 조회 - 빅 데이터 분석에 일반적으로 사용되는 도구는 무엇입니까?

빅 데이터 분석에 일반적으로 사용되는 도구는 무엇입니까?

빅 데이터 분석은 매우 크고 복잡하며 특별히 설계된 하드웨어 및 소프트웨어 도구가 필요한 데이터 세트를 가리키는 광범위한 용어입니다. 이 데이터 세트의 크기는 보통 조 또는 EB 입니다. 이러한 데이터 세트는 센서, 기후 정보, 잡지, 신문, 문장 등 다양한 출처에서 수집됩니다. 빅 데이터 분석의 또 다른 예로는 구매 거래 기록, 온라인 로그, 의료 기록, 군사 모니터링, 비디오 및 이미지 파일, 대규모 전자 상거래 등이 있습니다.

빅 데이터 분석, 그들은 기업에 미치는 영향에 높은 관심을 가지고 있다. 빅 데이터 분석은 대량의 데이터를 연구하는 과정에서 패턴, 관련성 등 유용한 정보를 발견하여 기업이 변화에 더 잘 적응하고 보다 현명한 결정을 내리는 데 도움이 됩니다.

첫째, 하닷컴 (Hadoop) 은

Hadoop 은 전체 클러스터가 간단한 프로그래밍 모델 컴퓨터를 사용하여 분산 환경에서 큰 데이터를 저장하고 처리할 수 있도록 하는 오픈 소스 프레임워크입니다. 그 목적은 단일 서버에서 수천 대의 컴퓨터로 확장하는 것입니다. 각 시스템은 로컬 컴퓨팅 및 스토리지를 제공할 수 있습니다.

Hadoop 은 대량의 데이터를 배포할 수 있는 소프트웨어 프레임워크이다. 그러나 Hadoop 은 안정적이고 효율적이며 확장 가능한 방식으로 처리됩니다. 하닷컴

컴퓨팅 구성 요소 및 스토리지에 장애가 발생하더라도 작업 데이터의 여러 사본을 유지 관리하여 장애가 발생한 노드에 처리를 재할당할 수 있도록 합니다. Hadoop 은 효율적이고 병렬로 작동하며 병렬 처리를 통해 처리 속도를 높입니다. 하닷컴

또한 페타바이트급 데이터를 처리할 수 있는 확장 가능합니다. 또한 Hadoop 은 커뮤니티 서버에 의존하므로 비용이 상대적으로 낮아 누구나 사용할 수 있습니다.

Hadoop 은 쉽게 구축하고 사용할 수 있는 분산 컴퓨팅 플랫폼입니다. 사용자는 Hadoop 에서 대량의 데이터를 처리하는 응용 프로그램을 쉽게 개발하고 실행할 수 있습니다. 이 제품은 주로 다음과 같은 장점을 가지고 있습니다.

1, 높은 신뢰성. Hadoop 이 데이터를 조금씩 저장하고 처리하는 능력은 믿을 만하다.

2. 뛰어난 확장성. Hadoop 은 사용 가능한 컴퓨터 클러스터 간에 데이터를 배포하고 컴퓨팅 작업을 완료하여 수천 개의 노드로 쉽게 확장할 수 있습니다.

3. 효율이 높다. Hadoop 은 노드 간에 데이터를 동적으로 이동하여 각 노드의 동적 균형을 보장하므로 처리 속도가 매우 빠릅니다.

4. 높은 내결함성. Hadoop 은 데이터의 여러 사본을 자동으로 저장하고 실패한 작업을 자동으로 재할당할 수 있습니다.

Hadoop 에는 Java 언어로 작성된 프레임워크가 있어 Linux 프로덕션 플랫폼에서 실행하는 것이 이상적입니다. Hadoop 의 앱도 다른 언어로 쓸 수 있습니다. 예를 들면 다음과 같습니다.

C++.

둘째, HPCC

HPCC, 고성능 컴퓨팅 및

통신 (고성능 컴퓨팅 및 통신) 의 약어입니다. 1993 년 미국 연방 과학, 엔지니어링 및 기술 조정위원회는 HPCC 프로그램, 즉 미국 대통령 과학 전략 프로젝트라고도 하는' 주요 도전 프로젝트: 고성능 컴퓨팅 및 통신' 보고서를 의회에 제출했습니다. 그 목적은 연구와 개발을 강화함으로써 몇 가지 중요한 과학 기술 도전을 해결하는 것이다. HPCC 는 미국이 정보 고속도로를 실시하는 계획이다. 이 계획의 시행에는 수백 억 달러가 들 것이다. 주요 목표는 확장 가능한 컴퓨팅 시스템 및 관련 소프트웨어를 개발하여 이더넷의 전송 성능을 지원하고, 기가비트 네트워킹 기술을 개발하고, 연구 및 교육 기관 및 네트워크 연결 기능을 확대하는 것입니다.

이 프로젝트는 주로 다섯 부분으로 구성됩니다.

1, 고성능 컴퓨터 시스템 (HPCS), 향후 세대의 컴퓨터 시스템 연구, 시스템 설계 도구, 고급 일반 시스템 및 레거시 평가 등을 포함합니다.

2. 큰 도전에 대한 소프트웨어 지원, 새로운 알고리즘 설계, 소프트웨어 분기 및 도구, 컴퓨팅 및 고성능 컴퓨팅 연구 센터 등을 포함한 고급 소프트웨어 기술 및 알고리즘 (ASTA).

3. 도킹 스테이션 및 654.38+0 억 비트 전송 개발을 포함한 국가 연구 및 교육 그리드 (NREN);

4. 기초 연구 및 인적 자원 (BRHR) 에는 설문 조사 (시작 및 장기 조사) 를 장려함으로써 확장 가능한 고성능 컴퓨팅 분야의 혁신 의식을 높이고, 교육 및 고성능 컴퓨팅 교육 및 교류를 개선하여 숙련 및 훈련된 인력의 합작 투자를 늘리고, 이러한 조사 및 연구 활동을 지원하는 데 필요한 인프라를 제공하기 위한 기초 연구, 교육, 교육 및 교과 과정 자료가 포함되어 있습니다.

5. 정보 인프라 기술 및 응용 (IITA) 은 미국이 선진 정보 기술 발전에서 선두를 유지하도록 설계되었습니다.

셋째, 폭풍

Storm 은 무료, 오픈 소스, 분산, 내결함성이 높은 실시간 컴퓨팅 시스템입니다. Storm 은 연속 흐름 계산을 쉽게 만들어 Hadoop 배치가 충족하지 못하는 실시간 요구 사항을 보완합니다. Storm 은 실시간 분석, 온라인 기계 학습, 연속 컴퓨팅, 분산 원격 호출 및 ETL 에 자주 사용됩니다. Storm 의 배포 관리는 매우 간단합니다. Storm 의 성능은 동종 스트리밍 컴퓨팅 도구에서 매우 뛰어납니다.

Storm 은 분산되고 내결함성이 있는 실시간 컴퓨팅 시스템인 무료 오픈 소스 소프트웨어입니다. Storm 은 거대한 데이터 스트림을 매우 안정적으로 처리할 수 있으며 Hadoop 의 대량 데이터를 처리하는 데 사용할 수 있습니다. Storm 은 간단하고 다양한 프로그래밍 언어를 지원하며 사용하기 매우 재미있다. 폭풍은 트위터에서 나왔고, 다른 유명 앱으로는 Groupon, 타오바오, 알리페이, 알리바바, 음악 요소, Admaster 등이 있다.

Storm 에는 실시간 분석, 온라인 기계 학습, 지속적인 컴퓨팅, 분산 RPC (원격 프로시저 호출 프로토콜, 네트워크를 통해 원격 컴퓨터 프로그램에 서비스 요청) 등 다양한 응용 프로그램이 있습니다.

ETL (추출-변환-로드의 약어) 등. Storm 의 처리 속도는 매우 놀랍습니다. 노드당 초당 654.38+0 만 개의 데이터 그룹을 처리할 수 있도록 테스트되었습니다. Storm 은 확장성, 내결함성, 설정 및 운영이 용이합니다.

넷째, 아파치 훈련

Apache Software Foundation 은 최근 기업 사용자가 Hadoop 데이터 쿼리 속도를 높일 수 있는 보다 효과적인 방법을 찾을 수 있도록' 드릴' 이라는 오픈 소스 프로젝트를 출시했습니다. 길거리 건달

Drill 은 Google 의 Dremel 을 구현했습니다. Drill 은 Apache 인큐베이터 프로젝트로 운영되었으며 글로벌 소프트웨어 엔지니어를 대상으로 지속적으로 홍보될 예정입니다.

이 프로젝트는 구글 Dremel 의 오픈 소스 버전을 만들 것이다.

Hadoop 도구 (구글은 이 도구를 사용하여 Hadoop 데이터 분석 도구의 인터넷 응용 프로그램을 가속화합니다.) 드릴링은 Hadoop 사용자가 대용량 데이터 세트를 더 빨리 쿼리할 수 있도록 도와줍니다.

"Drill" 프로젝트는 구글 Dremel 프로젝트에서 영감을 얻었습니다. 구글이 웹 문서 분석 및 캡처, Android 추적 및 설치 등 방대한 데이터 세트 분석 및 처리를 수행할 수 있도록 도와주는 프로젝트입니다.

시장의 응용 데이터, 스팸메일 분석, 구글의 분산 구축 시스템에 대한 테스트 결과 분석 등이 있습니다.

조직은' Drill”Apache 오픈 소스 프로젝트를 개발하여 DRILL 이 속한 API 인터페이스와 유연하고 강력한 아키텍처를 구축하여 광범위한 데이터 소스, 데이터 형식 및 쿼리 언어를 지원할 수 있습니다.

동사 (verb 의 약어) 빠른 채광 기계

RapidMiner 는 기계 학습 프로그램을 제공합니다. 데이터 마이닝은 데이터 시각화, 처리, 통계 모델링 및 예측 분석을 포함합니다.

RapidMiner 는 세계 최고의 데이터 마이닝 솔루션으로, 대부분 첨단 기술을 채택하고 있습니다. 데이터 마이닝 작업은 데이터 마이닝 프로세스의 설계 및 평가를 단순화할 수 있는 다양한 데이터 예술을 포함하여 광범위한 영역을 포괄합니다.

기능 및 특징

데이터 마이닝 기술 및 라이브러리 무료 제공 100% Java 코드 사용 (운영 체제에서 실행 가능); 데이터 마이닝 프로세스는 간단하고 강력하며 직관적입니다. 내부 XML 은 exchange 데이터 마이닝 프로세스가 표준화된 형식으로 표현되도록 합니다. 대형 프로세스는 간단한 스크립팅 언어로 자동화할 수 있습니다. 데이터가 효율적이고 투명한지 확인하는 다단계 데이터 뷰 그래픽 사용자 인터페이스의 대화식 프로토타입 명령줄 (배치 모드) 자동 대규모 애플리케이션 자바 언어 (특히 웹 사이트를 만드는 데 사용되는 컴퓨터 언어)

API (응용 프로그래밍 인터페이스); 간단한 플러그인 및 홍보 메커니즘; 강력한 시각화 엔진, 수많은 최첨단 고차원 데이터의 시각화 모델링 400 개 이상의 데이터 마이닝 운영자가 지원합니다. 예일 대학은 텍스트 마이닝, 멀티미디어 마이닝, 기능 설계, 데이터 흐름 마이닝, 통합 개발 방법, 분산 데이터 마이닝 등 다양한 응용 분야에 성공적으로 적용되었습니다.

RapidMiner 의 한계; RapidMiner 는 행 수에 대한 크기 제한이 있습니다. RapidMiner 의 경우 ODM 및 SAS 보다 더 많은 하드웨어 리소스가 필요합니다.

자동동사 Pentaho BI

Pentaho BI 플랫폼은 기존 BI 와 다릅니다.

제품, 프로세스 중심의 솔루션 지향 프레임워크입니다. 그 목적은 비즈니스 인텔리전스 애플리케이션 개발을 용이하게 하기 위해 다양한 엔터프라이즈 BI 제품, 오픈 소스 소프트웨어, API 등의 구성 요소를 통합하는 것입니다. 그 출현으로 Jfree, Quartz 등 비즈니스 인텔리전스를 위한 다양한 독립 제품이 통합되어 복잡하고 완벽한 비즈니스 인텔리전스 솔루션을 형성할 수 있게 되었습니다.

Pentaho BI 플랫폼, Pentaho Open BI

이 제품군의 핵심 아키텍처와 기반은 중앙 컨트롤러가 워크플로우 엔진이기 때문에 프로세스 중심입니다. 워크플로우 엔진은 프로세스 정의를 사용하여 BI 에서 프로세스 정의를 정의합니다

플랫폼에서 실행되는 비즈니스 인텔리전스 프로세스입니다. 프로세스를 쉽게 사용자 정의하고 새 프로세스를 추가할 수 있습니다. 양성애자

이 플랫폼에는 이러한 프로세스의 성능을 분석하는 구성 요소 및 보고서가 포함되어 있습니다. 현재 Pentaho 의 주요 구성 요소에는 보고서 생성, 분석, 데이터 마이닝 및 워크플로우 관리가 포함됩니다. 이러한 구성 요소는 다음과 같은 방법으로 구현됩니다

Pentaho 플랫폼은 J2EE, 웹 서비스, SOAP, HTTP, Java, JavaScript, Portals 등의 기술을 통합합니다.

Pentaho 의 출시는 주로 Pentaho SDK 의 형태로 이루어집니다.

펜타호

SDK*** 는 Pentaho 플랫폼, Pentaho 샘플 데이터베이스, 독립적으로 실행할 수 있는 Pentaho 플랫폼, Pentaho 솔루션 샘플, 미리 준비된 샘플 등 다섯 부분으로 구성됩니다.

Pentaho 웹 서버. 그 중 Pentaho 플랫폼은 Pentaho 플랫폼의 가장 중요한 부분이며, Pentaho 플랫폼의 주요 소스 코드를 포함하고 있습니다. Pentaho 데이터베이스는

Pentaho 플랫폼은 구성 정보, 솔루션 관련 정보 등 데이터 서비스를 제공합니다. , Pentaho 플랫폼의 경우 필요하지 않습니다. 구성을 통해 다른 데이터베이스 서비스로 교체할 수 있습니다. 독립적으로 실행할 수 있는 Pentaho 플랫폼은 Pentaho 플랫폼 독립 실행 모드의 예로, 응용 프로그램 서버 지원 없이 Pentaho 플랫폼을 독립적으로 실행할 수 있는 방법을 보여 줍니다.

Pentaho 솔루션의 예는 Pentaho 플랫폼을 위한 관련 비즈니스 인텔리전스 솔루션을 개발하는 방법을 보여주는 Eclipse 프로젝트입니다.

Pentaho BI 플랫폼은 서버, 엔진 및 구성 요소를 기반으로 합니다. 이것들은 시스템의 J2EE 를 제공한다.

서버, 보안, 포털, 워크플로우, 규칙 엔진, 차트, 협업, 컨텐츠 관리, 데이터 통합, 분석 및 모델링 기능. 이러한 구성 요소의 대부분은 표준을 기반으로 하며 다른 제품으로 대체될 수 있습니다.

일곱, 드루이

Druid 는 Java 언어 중 최고의 데이터베이스 연결 풀인 실시간 데이터 분석 스토리지 시스템입니다. 드루이드는 강력한 모니터링과 확장 기능을 제공할 수 있다.

여덟, 암바리

대형 데이터 플랫폼 구축 및 모니터링 도구 마찬가지로, CDH 입니다.

1, Hadoop 클러스터 제공

Ambari 는 원하는 수의 호스트에 Hadoop 서비스를 설치하는 단계별 마법사를 제공합니다.

Ambari 는 클러스터 Hadoop 서비스의 구성을 처리합니다.

2. Hadoop 클러스터 관리

Ambari 는 전체 클러스터에 대해 Hadoop 서비스를 시작, 정지 및 재구성하는 중앙 집중식 관리를 제공합니다.

3. Hadoop 클러스터 모니터링

Ambari 는 Hadoop 클러스터의 상태와 상태를 모니터링하는 대시보드를 제공합니다.

아홉, 불꽃

대규모 데이터 처리 프레임워크 (기업에서 흔히 볼 수 있는 세 가지 데이터 처리 시나리오: 복잡한 대량 데이터 처리 (대량 데이터 처리)

가공); 과거 데이터를 기반으로 한 대화식 쿼리 실시간 데이터 흐름 기반 데이터 처리, Ceph:Linux 분산 파일 시스템.

X.Tableau 공용

1.Tableau Public 이란 무엇입니까?-빅 데이터 분석 도구?

이것은 간단하고 직관적인 도구이다. 데이터 시각화를 통해 흥미로운 통찰력을 제공하기 때문입니다. (무대에서 사람이 분장한) 정적 화면

Public 의 백만 행 제한. 데이터 분석 시장에 있는 대부분의 다른 게이머들보다 운임을 더 쉽게 사용할 수 있기 때문이다. Tableau 의 시각 효과를 이용하여 가설을 조사할 수 있다. 또한, 데이터를 찾아보고, 자신의 의견을 교차 점검한다.

2.Tableau Public 사용

대화형 데이터 시각화를 웹에 무료로 게시할 수 있습니다. 프로그래밍 기술이 필요하지 않습니다. Tableau 에 게시

공공 이미지는 블로그에 내장될 수 있다. 또한 이메일이나 소셜 미디어를 통해 웹 페이지를 공유할 수 있습니다. * * * 좋아하는 콘텐츠는 유효한 황으로 다운로드 할 수 있습니다. 이것은 최고의 빅 데이터 분석 도구로 만듭니다.

3.Tableau Public 의 한계

모든 데이터는 공개되며 액세스를 제한하는 범위는 매우 작습니다. 데이터 크기 제한 [r; 에 연결할 수 없습니다 유일한 읽기 방법은 OData source, Excel 또는 txt 를 사용하는 것입니다.

XI. 오픈 refine

1 .. open refine- 이란 무엇입니까? 데이터 분석 도구입니다.

데이터 정리 소프트웨어 (이전 명칭: GoogleRefine). 분석을 위해 데이터를 정리하는 데 도움이 되기 때문입니다. 한 줄의 데이터를 조작합니다. 또한 열 아래에 열을 배치하는 것은 관계형 데이터베이스 테이블과 매우 유사합니다.

2. 오픈 참조의 사용

지저분한 데이터 정리 데이터 변환 웹 사이트의 데이터 분석 웹 서비스에서 데이터를 가져와 데이터 세트에 데이터를 추가합니다. 예를 들어 OpenRefine 을 사용하여 지리적 좌표에 따라 주소를 지리적으로 인코딩할 수 있습니다.

3. 오픈 참조의 한계

오픈 참조는 대규모 데이터 세트에 적합하지 않습니다. 정련은 큰 데이터에 효과가 없다.

열두. KNIME

1, KNIME- 데이터 분석 도구란 무엇입니까?

KNIME 는 시각화 프로그래밍을 통해 데이터를 조작, 분석 및 모델링하는 데 도움을 줍니다. 데이터 마이닝과 기계 학습의 다양한 구성 요소를 통합하는 데 사용됩니다.

2.KNIME 의 목적

코드 블록을 쓰지 마세요. 대신 활동 사이의 연결점을 삭제하고 드래그해야 합니다. 데이터 분석 도구는 프로그래밍 언어를 지원합니다. 사실, 확장 가능한 운영 화학 데이터, 텍스트 마이닝, 파이썬 및 [R 과 같은 분석 도구.

3.KNIME 의 제한 사항

데이터 시각화 차이

열세 살. 구글 컨버전스 테이블

1. 구글 컨버전스표란 무엇입니까?

데이터 도구의 경우, 우리는 더 멋지고 더 큰 구글 스프레드시트 버전을 가지고 있다. 대규모 데이터 세트의 데이터 분석, 드로잉 및 시각화를 위한 놀라운 도구입니다. 또한 구글은

융합 테이블은 비즈니스 분석 도구 목록에 추가할 수 있습니다. 이것은 또한 최고의 빅 데이터 분석 도구 중 하나입니다.

2. 구글 컨버전스 테이블을 사용합니다.

더 큰 양식 데이터를 온라인으로 시각화합니다. 수십만 행에 걸쳐 요약을 필터링합니다. 양식을 웹의 다른 데이터와 결합합니다. 두 개 또는 세 개의 테이블을 결합하여 데이터 세트가 포함된 단일 시각 효과를 생성할 수 있습니다.

구글 컨버전스 테이블의 한계

테이블의 처음100,000 행 데이터만 쿼리 결과에 포함되거나 매핑됩니다. API 호출에서 전송된 총 데이터 크기는 1MB 를 초과할 수 없습니다.

열네. NodeXL

1, NodeXL 이란 무엇입니까?

관계와 네트워크의 시각화 및 분석 소프트웨어입니다. NodeXL 은 정확한 계산을 제공합니다. 무료 (비전문가) 및 오픈 소스 네트워크 분석 및 시각화 소프트웨어입니다. NodeXL 은 최고의 데이터 분석 통계 도구 중 하나입니다. 여기에는 고급 네트워크 표시기가 포함됩니다. 또한 소셜 미디어 네트워크 데이터 가져오기 프로그램 및 자동화에 액세스할 수 있습니다.

2.NodeXL 의 용도

이 도구는 Excel 의 데이터 분석 도구로서 다음과 같은 측면을 구현하는 데 도움이 됩니다.

데이터 가져오기 그래픽 시각화 그래픽 분석 데이터 표현 이 소프트웨어는 Microsoft Excel 에 통합되어 있습니다.

2007 년, 20 10, 20 13, 20 16. 그래픽 구조 요소가 포함된 다양한 워크시트가 포함된 통합 문서로 열립니다. 이것은 노드와 가장자리와 같습니다. 소프트웨어는 다양한 그래픽 형식을 가져올 수 있습니다. 이 인접 행렬, 파잭

。 그물, UCINet. Dl, GraphML 및 가장자리 리스트입니다.

3.NodeXL 의 제한 사항

특정 문제에 대해 여러 시드 용어를 사용해야 합니다. 약간 다른 시간에 데이터 추출을 실행합니다.

15, 볼프람 알파

1, 울프램 알파는 무엇입니까?

스티브 볼프럼이 만든 컴퓨팅 지식 엔진이나 응답 엔진입니다.

2. 울프램 알파의 사용

애플 시리의 추가 구성 요소입니다. 기술 검색에 대한 자세한 응답을 제공하여 미적분 문제를 해결합니다. 비즈니스 사용자가 정보 차트와 그래프를 얻을 수 있도록 도와줍니다. 또한 주제 개요, 상품 정보 및 고급 가격 내역을 만드는 데도 도움이 됩니다.

3. 울프램 알파의 한계

Wolfram Alpha 는 공적인 인물과 사실만 처리할 수 있고, 관점은 처리할 수 없다. 각 쿼리의 계산 시간을 제한합니다. 데이터 분석을 위한 이러한 통계 도구에는 어떤 문제가 있습니까?

16, 구글 검색 운영자

1 .. 구글 검색 운영자란 무엇입니까?

구글 검색 결과를 필터링하는 데 도움이 되는 강력한 자원입니다. 이를 통해 가장 관련성이 높고 유용한 정보를 즉시 얻을 수 있습니다.

2, Google 검색 운영자 사용

Google 검색 결과를보다 신속하게 필터링하십시오. 구글의 강력한 데이터 분석 도구는 새로운 정보를 찾는 데 도움이 된다.

열일곱, 엑셀 해결자

1. Excel 계획 솔루션이란 무엇입니까

솔루션 로드 매크로 계획은 Microsoft Office Excel 로드 매크로 프로그램입니다. 또한 Microsoft 를 설치한 것은 이번이 처음입니다.

Excel 또는 Office 에서 사용 가능합니다. Excel 의 선형 계획 및 최적화 도구입니다. 이렇게 하면 구속조건을 설정할 수 있습니다. 문제를 신속하게 해결하는 데 도움이 되는 고급 최적화 도구입니다.

2, 솔루션 사용 계획

해결자가 찾은 최종 값은 관계와 의사 결정에 대한 해결책입니다. 비선형 최적화에서 여러 가지 방법을 사용합니다. 선형 프로그래밍에서 진화 알고리즘과 유전 알고리즘에 이르기까지 다양합니다.

3. 계획 솔루션의 한계

확장 오류는 Excel 계획 해결의 누락된 측면 중 하나입니다. 해결의 시간과 품질에 영향을 미칩니다. 계획 솔루션은 모델의 내부 해결 가능성에 영향을 미칩니다.

열여덟. 대형 라이브러리 의사 결정 지원 시스템

1. 대형 라이브러리 DSS 란 무엇입니까?

이것은 협업 데이터 과학 소프트웨어 플랫폼입니다. 또한 팀 구성, 프로토타입 제작 및 탐구에도 도움이 됩니다. 그러나 자체 데이터 제품을 보다 효율적으로 제공할 수 있습니다.

2.Dataiku DSS 사용

데이터 분석 도구는 대화식 시각화 인터페이스를 제공합니다. 따라서 SQL 과 같은 언어를 구축, 클릭, 포인팅 또는 사용할 수 있습니다.

데이터웨어 하우스 의사 결정 지원 시스템의 한계

시각화 기능이 제한적입니다. UI 장애: 코드/데이터 세트 다시 로드 전체 코드는 단일 문서/노트북으로 쉽게 컴파일되지 않습니다. 여전히 SPARK 와의 통합이 필요합니다

위의 도구는 빅데이터 분석에 사용되는 일부 도구일 뿐, 변쇼는 일일이 열거하지 않는다. 몇 가지 도구의 용도를 분류해 보겠습니다.

1, 전면 디스플레이

프레젠테이션 분석을 위한 프런트엔드 오픈 소스 도구에는 JasperSoft, Pentaho, Spagobi, Openi, Birt 등이 있습니다.

분석 비즈니스 분석 도구에는 Style Intelligence, RapidMiner Radoop, Cognos, BO, Microsoft 가 포함됩니다.

파워 bi, Oracle, Microstrategy, QlikView, Tableau.

국내에는 BDP, 곽운데이터 (대데이터 분석 미러링), 스마트, FineBI 등이 있습니다.

2. 데이터 웨어하우스

Teradata aster data, EMC Greenplum, HP Vertica 등.

3. 데이터 마트

QlikView, Tableau, Style Intelligence 등이 있습니다.

copyright 2024회사기업대전