다음은 가장 중요한 빅데이터 면접 질문과 구체적인 질문에 대한 자세한 대답입니다. 더 광범위한 질문에 대한 답은 당신의 경험에 달려 있으며, 우리는 어떻게 대답해야 하는지에 대한 기교를 공유할 것이다.
10 빅 데이터 면접 초급 질문 빅 데이터 면접이 있을 때마다 면접관은 기초적인 질문을 할 수 있다. 당신이 빅 데이터 분야의 초보자이든 베테랑이든, 기초 지식이 필요하다. 그래서 몇 가지 일반적인 기초 빅 데이터 면접 질문과 빅 데이터 면접에 대한 답을 소개하겠습니다.
1. 당신은' 빅 데이터' 라는 단어에 대해 얼마나 알고 있습니까?
답:? 큰 데이터는 복잡하고 큰 데이터 세트와 관련된 용어입니다. 관계형 데이터베이스는 큰 데이터를 처리할 수 없습니다. 그래서 특별한 도구와 방법을 사용하여 대량의 데이터를 조작해야 합니다. 빅 데이터는 기업이 비즈니스를 더 잘 이해하고 정기적으로 수집된 비정형 및 원시 데이터에서 의미 있는 정보를 얻을 수 있도록 지원합니다. 빅데이터는 또한 기업이 데이터 지원을 통해 더 나은 비즈니스 결정을 내릴 수 있도록 합니다.
빅 데이터의 v 5 개는 무엇입니까?
A: 빅 데이터의 v 5 개는 다음과 같습니다.
볼륨 볼륨이란 대용량, 즉 빠르게 증가하는 데이터의 양, 즉 페타바이트 단위의 데이터 양을 의미합니다.
속도-속도는 데이터가 증가하는 속도입니다. 소셜 미디어는 데이터 증가 속도에서 중요한 역할을 합니다.
다양성-다양성이란 서로 다른 데이터 유형, 즉 텍스트, 오디오, 비디오 등과 같은 다양한 데이터 형식을 말합니다.
정확도-정확도는 사용 가능한 데이터의 불확실성을 나타냅니다. 대량의 데이터가 가져오는 불완전성과 불일치로 인해 정확도가 생겨났다.
가치-가치는 데이터를 가치로 변환하는 것을 의미합니다. 방문한 빅 데이터를 가치로 전환함으로써 기업은 수익을 창출할 수 있다.
참고:? 이것은 빅데이터 면접에서 제기된 기본적이고 중요한 문제 중 하나이다. 면접관이 더 많은 정보를 알고 싶어하는 것을 본다면, 당신은 이 다섯 개의 V 를 설명할 수 있습니까? 그러나,' 빅 데이터' 라는 용어를 물어본다면, 심지어 그 이름들을 언급할 수도 있다. (윌리엄 셰익스피어, 빅데이터, 빅데이터, 빅데이터, 빅데이터, 빅데이터, 빅데이터)
3. 빅데이터와 해돔이 어떻게 서로 연관이 있는지 알려주세요.
답:? 빅 데이터와 해돔은 거의 동의어입니다. 빅데이터가 등장하면서 빅 데이터 컴퓨팅을 전문으로 하는 Hadoop 프레임워크도 유행하기 시작했다. 전문가들은 이 프레임워크를 이용하여 큰 데이터를 분석하여 기업의 의사결정을 도울 수 있다.
참고:? -응? 이 문제는 보통 빅데이터 면접에서 질문을 받는다. -응? 이 질문에 더 대답하고 Hadoop 의 주요 구성 요소를 설명해 볼 수 있습니다.
빅 데이터 분석은 비즈니스 수익을 높이는 데 어떻게 도움이 됩니까?
A: 빅 데이터 분석은 비즈니스에 매우 중요합니다. 기업이 차별화하고 수입을 늘리는 데 도움이 될 수 있다. 빅 데이터 분석은 예측 분석을 통해 기업에 맞춤형 권장 사항과 의견을 제공합니다. 또한 빅 데이터 분석을 통해 기업은 고객의 요구와 선호도에 따라 신제품을 출시할 수 있습니다. 이러한 요인들로 인해 기업들은 더 많은 수익을 거둘 수 있게 되었으며, 따라서 기업들은 큰 데이터 분석을 사용하고 있습니다. 빅 데이터 분석을 구현함으로써 회사는 5 ~ 20% 의 수익을 크게 늘릴 수 있습니다. 월마트, LinkedIn, 페이스북, 트위터, 미국은행 등 빅데이터 분석을 통해 수입을 늘리는 인기 있는 기업들도 있다.
5. 대용량 데이터 솔루션을 배포할 때 따라야 할 단계를 설명합니다.
A: 다음은 대용량 데이터 솔루션을 배포하는 세 단계입니다.
I. 데이터 입력
대용량 데이터 솔루션을 구축하는 첫 번째 단계는 데이터 추출, 즉 다양한 소스에서 데이터를 추출하는 것입니다. 데이터 소스는 CRM (예: Salesforce), 전사적 자원 계획 시스템 (예: SAP), RDBMS (예: MySQL) 또는 기타 로그 파일, 문서, 소셜 미디어 소스 등이 될 수 있습니다. 배치 작업 또는 라이브 스트림을 통해 데이터를 추출할 수 있습니다. 그런 다음 추출된 데이터를 HDFS 에 저장합니다.
둘. 데이터 저장소
데이터가 수신되면 다음 단계는 추출된 데이터를 저장하는 것입니다. 데이터는 HDFS 또는 NoSQL 데이터베이스 (예: HBase) 에 저장됩니다. HDFS 스토리지는 순차적 액세스에 적합하고 HBase 는 랜덤 읽기/쓰기 액세스에 적합합니다.
셋. 데이터 처리
대용량 데이터 솔루션을 배포하는 마지막 단계는 데이터 처리입니다. 데이터는 Spark, MapReduce, Pig 등의 처리 프레임워크 중 하나에 의해 처리됩니다.
6. HDFS 및 원사의 해당 성분을 정의하십시오.
답:? HDFS 의 두 가지 주요 구성 요소:
NameNode? HDFS 에서 블록 메타데이터 정보를 처리하는 마스터 노드입니다.
Datanode/slave node-데이터를 저장하는 노드로서 NameNode 로 처리되고 사용되는 슬레이브 노드입니다.
클라이언트 요청을 제공하는 것 외에도 NameNode 는 다음 두 가지 역할 중 하나를 수행합니다.
Checkpoint node-NameNode 와는 다른 호스트에서 실행됩니다.
BackupNode- 읽기 전용 NameNode 로 파일 시스템 메타데이터 정보를 포함하며 블록 위치는 포함하지 않습니다.
원사의 두 가지 주요 구성 요소:
리소스 매니저-이 구성 요소는 처리 요청을 수신하고 필요에 따라 각 노드 관리자에게 요청을 배포합니다.
노드 관리자-각 개별 데이터 노드에서 작업을 수행합니다.
7.Hadoop 이 큰 데이터 분석에 사용될 수 있는 이유는 무엇입니까?
답:? 데이터 분석이 비즈니스의 핵심 매개 변수 중 하나가 되었기 때문에 기업에서는 대량의 정형, 비정형 및 반정형 데이터를 처리하고 있습니다. Hadoop 이 주로 기능을 지원하는 경우 구조화되지 않은 데이터를 분석하기가 어렵습니까?
구조
처리하다
데이터 수집
또한 Hadoop 은 상용 하드웨어에서 실행할 수 있는 오픈 소스입니다. 그래서 기업에게는 가격 대비 성능이 뛰어난 솔루션입니다.
8.fsck 란 무엇입니까?
답:? Fsck 는 파일 시스템 검사를 나타냅니다. HDFS 에서 사용하는 명령입니다. 이 명령은 파일의 불일치성과 문제가 있는지 확인하는 데 사용됩니다. 예를 들어, 파일에 누락된 데이터 블록이 있을 경우 HDFS 는 이 명령에 대한 알림을 받습니다.
9.NAS 와 HDFS 의 주요 차이점은 무엇입니까?
답:? NAS (network attached storage) 와 HDFS 의 주요 차이점은 다음과 같습니다
HDFS 는 컴퓨터 그룹에서 실행되는 반면 NAS 는 단일 시스템에서 실행됩니다. 따라서 데이터 중복은 HDFS 의 일반적인 문제입니다. 반대로, NAS 의 경우 복제 프로토콜은 다르다. 따라서 데이터 중복의 가능성은 훨씬 적습니다.
HDFS 의 경우 데이터는 로컬 드라이브에 블록으로 저장됩니다. NAS 의 경우 전용 하드웨어에 저장됩니다.
10. NameNode 형식 지정 명령은 무엇입니까?
답:? $ HDFS 이름 형식.
컨설팅은 모두 온라인 고객서비스입니다. 빅데이터 전문가 팀을 연결해 드리며 관련 자료를 보내 드리겠습니다!
이상은 빅데이터 면접 문답입니다. 제 대답이 도움이 되었으면 합니다!