나는 방금 옛 친구와 연락했다. 그녀는 항상 데이터 과학에 관심이 있었지만 10 개월 전에야 이 분야에 발을 들여놓았다. 그녀는 데이터 과학자로 활동하는 조직에 가입했다. 나는 그녀가 새 직장에서 많은 것을 배웠다는 것을 분명히 느꼈다. 하지만 우리가 이야기를 나눌 때, 그녀는 한 가지 사실, 혹은 지금까지 내 머릿속에 맴돌고 있는 문제를 언급했다. 그녀는 그녀가 어떻게 행동하든, 모든 프로젝트나 분석 임무를 여러 번 해야 사장이 만족할 수 있다고 말했다. 그녀는 또한 나중에 자주 발견하는데 그렇게 많은 시간이 걸리지 않는다고 언급했다!
너에게 일어난 일처럼 들리니? 너는 여러 번 분석해서야 그럴듯한 답을 얻을 수 있니? 아니면 비슷한 활동에 대한 코드를 반복해서 쓰나요? 그렇다면, 이 문장 바로 너에게 어울린다. 효율성을 높이고 불필요한 반복 작업을 줄일 수 있는 몇 가지 방법을 공유하겠습니다.
주: 오해하지 마세요. 나는 반복이 좋지 않다고 말하는 것이 아니다. 이 문서에서는 어떤 반복이 필요한지, 어떤 반복이 필요한지, 어떤 반복이 필요하지 않은지, 피해야 하는지 파악하는 방법에 초점을 맞추고 있습니다.
데이터 분석에서 중복 작업의 원인은 무엇입니까? 나는 새로운 정보를 추가하지 않고 분석을 반복할 필요가 없다고 생각한다 (나중에 한 가지 예외를 언급). 다음과 같은 반복 작업을 피할 수 있습니다.
고객 문제의 진단에 편차가 있어 수요를 충족시킬 수 없고 다시 해야 한다. 반복 분석의 목적은 이전에 필요하지 않다고 생각했던 변수를 더 많이 수집하는 것이다. 분석 활동에 영향을 미치는 편차 또는 가설은 이전에 고려하지 않았고, 나중에 고려하면 다시 해야 한다. (윌리엄 셰익스피어, 햄릿, 분석, 분석, 분석, 분석, 분석, 분석, 분석) 어떤 반복이 필요합니까? 여기 두 가지 예가 있습니다. 우선, 6 개월 후에 모델을 만든 다음 새로운 정보를 갖게 되므로 반복은 건강합니다. 둘째, 당신은 의도적으로 간단한 모델로 시작하여 점차 복잡한 모델을 이해하고 만듭니다.
위의 내용은 가능한 모든 상황을 다루지는 않지만, 이러한 예들은 당신의 분석 반복이 건강한지 판단하는 데 도움이 될 것이라고 믿습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 건강명언)
이러한 생산성 살인자의 영향? 우리는 한 가지를 알고 있습니다. 아무도 건강하지 않은 반복과 생산성 살인자가 분석에 나타나기를 원하지 않습니다. 모든 데이터 과학자들이 변수를 추가하면서 전체 분석 프로세스를 반복하는 것은 아닙니다.
분석가와 데이터 과학자들은 건강하지 않은 반복과 비효율적으로 인해 좌절감을 느끼고 성취감이 부족할 수 있습니다. 그럼 우리가 그들을 피하기 위해 최선을 다하겠습니다.
팁: 건강하지 않은 반복을 피하고 효율성을 높이는 방법 팁 1: 중요한 문제에만 집중합니다.
각 조직에는 데이터로 해결할 수 있는 작은 문제가 많이 있습니다! 그러나 데이터 과학자를 고용하는 주된 목적은 이러한 작은 문제를 해결하기 위해서가 아니다. 칼날에 강철을 잘 쓰려면 조직 전체에 가장 큰 영향을 미치는 3 ~ 4 개의 데이터 문제를 골라서 데이터 과학자에게 맡겨야 한다. 이러한 문제들은 일반적으로 도전적이며, 당신의 분석 활동에 가장 큰 지렛대 작용을 가져다 줄 것이다 (가득 찬 수익이든, 수익이 없거나, 대출과 주식을 상상해 보세요). 더 큰 문제가 해결되지 않았을 때, 너는 작은 문제를 해결해서는 안 된다.
별로 들리지는 않지만, 사실 많은 기관들이 잘하지 못하고 있습니다! 나는 많은 은행들이 위험 점수를 높이기 위해 데이터 분석보다는 마케팅을 하는 것을 보았다. 일부 보험 회사들은 데이터 분석을 이용하여 고객 보유율을 높이는 것이 아니라 대행사를 위한 인센티브를 마련하려고 합니다.
팁 2: 처음부터 데이터 분석 프레젠테이션 (가능한 레이아웃 및 구조) 을 작성합니다.
나는 줄곧 이것을 해왔고, 많은 이익을 얻었다. 분석 보고서를 작성하는 프레임워크는 프로젝트가 시작된 후 첫 번째여야 합니다. 이것은 직관에 어긋나는 것처럼 들릴지 모르지만, 일단 이 습관을 기르면 시간을 절약할 수 있다.
어떻게 틀을 만들 수 있을까요? Ppt, word, 혹은 한 단락의 말로 틀을 만들 수 있는데, 형식은 중요하지 않다. 처음부터 가능한 모든 상황을 나열하는 것이 중요하다. 예를 들어, 대손 충당금 환급률을 낮추려는 경우 다음과 같이 시연할 수 있습니다.
다음으로, 각 요인이 부실 채권 반제율에 어떤 영향을 미치는지 고려해 볼 수 있습니다. 예를 들어, 은행의 부실 채권 반제 비율은 고객의 신용 한도 증가로 인해 증가한다. 다음을 수행할 수 있습니다.
첫째, 신용 한도가 증가하지 않은 고객이 부실 채권 반제율 상승을 초래하지 않도록 해야 합니다.
다음으로, 수학 공식으로 이 영향을 측정한다.
분석의 모든 가지를 고려하면, 당신은 자신을 위한 좋은 출발점을 만들 수 있다. (존 F. 케네디, 공부명언)
팁 3: 데이터 요구 사항을 미리 정의하십시오.
데이터 요구 사항은 최종 분석 결과에서 직접 파생됩니다. 어떤 분석을 할 것인지, 어떤 결과가 나올지 전면적으로 계획했다면, 데이터 요구 사항이 무엇인지 알 수 있을 것이다. (존 F. 케네디, 공부명언) 다음은 도움이 될 수 있는 몇 가지 힌트입니다.
데이터 요구 사항에 대한 구조를 시도해 보십시오. 변수 목록을 작성하는 것이 아니라 분석 활동에 필요한 테이블을 명확하게 고려해야 합니다. 부실 채권 반제 비율 증가를 예로 들면 고객 인구 통계, 과거 마케팅 활동 통계, 과거 12 개월 고객 거래 기록, 은행 신용 정책 변경 문서 등의 정보가 필요합니다.
필요할 수 있는 모든 데이터 수집: 100% 로 모든 변수가 필요한지 확인할 수 없더라도 이 단계에서 모든 데이터를 수집해야 합니다. 이렇게 하려면 많은 작업이 필요하지만 이후 링크에 변수를 추가하여 데이터를 수집하는 것보다 효율적입니다.
관심 있는 데이터의 시간 간격을 정의합니다.
팁 4: 분석이 반복 가능한지 확인하십시오.
이 힌트는 간단할 수도 있지만 초보자와 고위 분석가에게는 파악하기 어렵다. 초보자는 데이터 복사 및 붙여넣기를 포함한 각 단계의 활동을 위해 Excel 을 사용합니다. 고급 사용자의 경우 명령줄 인터페이스를 통해 수행된 모든 작업이 재현되지 않을 수 있습니다.
마찬가지로 노트북을 사용할 때도 각별히 조심해야 한다. 특히 이전 데이터가 이후 단계에서 이미 사용 중인 경우 이전 단계를 직접 수정하는 것을 제한해야 합니다. 메모장은 전후 데이터 교차 검사 관계를 포함하는 이러한 데이터 흐름을 유지하는 데 매우 강력합니다. 그러나이 데이터 스트림이 메모장에서 유지 관리되지 않으면 쓸모가 없습니다.
팁 5: 표준 코드 라이브러리 구축
간단한 작업은 코드를 반복해서 다시 작성할 필요가 없습니다. 이것은 시간을 낭비할 뿐만 아니라 문법 오류도 초래할 수 있다. 또 다른 비결은 일반적인 작업을 위한 표준 코드 라이브러리를 작성하여 전체 팀과 공유하는 것입니다.
이를 통해 팀 전체가 동일한 코드를 사용할 수 있을 뿐만 아니라 더욱 효율적으로 작업할 수 있습니다.
팁 6: 중간 데이터 마트 구축
여러 번, 당신은 같은 정보를 반복해서 필요로 할 것이다. 예를 들어, 여러 분석 및 보고서에 모든 고객의 신용 카드 소비 기록을 사용할 수 있습니다. 매번 트랜잭션 로그 테이블에서 데이터를 추출할 수 있지만 이러한 테이블이 포함된 중간 데이터 마트를 만들면 시간과 노력을 절약할 수 있습니다. 마찬가지로 매번 마케팅 활동 요약 테이블을 조회할 필요가 없습니다.
팁 7: 예약 샘플 및 교차 검증을 사용하여 초과 맞춤을 방지합니다.
많은 초보자들이 샘플 보존과 교차 검증의 힘을 과소평가했다. 많은 사람들은 훈련 세트가 충분히 크면 거의 맞지 않기 때문에 교차 검증이나 샘플 유지가 필요하지 않다고 생각하는 경향이 있습니다.
이런 생각을 하면, 마지막 일은 종종 실수를 한다. 나 혼자만의 말이 아니다. Kaggle 에서 어떤 경기의 공개나 개인순위도 볼 수 있다. 현재 10 명의 사람들이 더 이상 적합하지 않을 때, 그들의 순위는 더 이상 떨어지지 않는다는 것을 알 수 있을 것이다. 여러분은 이것들이 모두 선임 데이터 과학자라고 상상할 수 있습니다.
팁 8: 일정 기간 동안 일에 집중하고 정기적으로 휴식을 취하십시오.
나에게 가장 좋은 작업 상태는 한 가지 문제나 프로젝트 2 ~ 3 시간 해결에 집중하는 것이다. 데이터 과학자로서, 너는 동시에 여러 가지 임무를 완수하기가 매우 어렵다. 문제를 해결하기 위해 최선을 다해야 합니다. 나에게는 2 ~ 3 시간의 시간 창구가 가장 효율적이다. 너는 개인적인 상황에 따라 스스로 설정할 수 있다.
후기 이상은 내가 업무 효율을 높이는 몇 가지 방법이다. 나는 처음으로 일을 잘 해낸다는 것을 강조하지는 않지만, 매번 일을 잘 하는 습관을 길러야 전문 데이터 과학자가 될 수 있다. (존 F. 케네디, 공부명언)
당신은 일의 효율을 높일 수 있는 좋은 방법이 있습니까? 아래 댓글에 메시지를 남겨 주세요.
원본 제목: 데이터 과학자의 8 가지 생산성 기술&; 비즈니스 분석가
번역 노트 1, 받아요? 위로? 무엇을 사용합니까? 어떤 사람 (somebody 의 속기) 도 누군가와 다시 연락하는 것을 뜻하는데, 되는 것과 맞먹는 것일까요? 현재? 무엇을 사용합니까? 뭐? 갈까? 열어? 네? 누군가의? 인생? 언제? 당신은요? 아니요? 가본 적 있어요? 네? 터치? 뭐 때문에? 대답? 안에 ... 기간
그럼 이 말의 뜻은? "다시 연락할 수 있어서 좋다.", 특히 한동안 못 봤는데 연락이 없을 때.
2, 생산성? 킬러, 생산성 킬러, 생산성 감소 요인, 생산성 향상을 방해하는 요소.
3. 부실 채권 반제율은 신용 카드 업계의 중요한 지표로, 월초 신용 카드 외상 매출금 총액의 연간 비율로 나누어 주로 자산의 신용 수준을 측정하는 데 쓰인다.
4. 그림의 브랜드? 전략? 변화, 브랜드 전략 변화로 인해 부실 채권 반제율이 상승할 수 있다. 예를 들어 경쟁 브랜드나 한계 브랜드 전략을 채택하면 부실 채권 반제율이 상승할 수 있다.
5. 브랜드 전략:
이미지 브랜드. 브랜드 경쟁에서 이미지 브랜드는 대중의 신뢰를 효과적으로 얻고, 좋은' 입소문' 효과를 형성하며, 브랜드 자본의 축적과 승진에 매우 중요한 역할을 하며, 기업의 다른 브랜드 홍보를 촉진할 수 있다. 예를 들어 네슬레의' 네슬레' 는 모브랜드로서 이미지 브랜드로 산하의 많은 하위 브랜드에 효과적인 홍보 역할을 했다. 따라서 기업의 브랜드 경영 전략은 이미지 브랜드가 없어서는 안 된다. 경쟁 브랜드는 일반적으로 시장에서 동종 제품을 대상으로 출시되며 기술, 가격, 서비스 특징 등 특수한 시장 포지셔닝을 통해 경쟁사의 방어선을 찢거나 새로운 목표 시장을 개척합니다. 분명히 경쟁 브랜드의 주요 목적은 기업을 위해 더 많은 시장 점유율을 확보하고 기업을 위해 경쟁 우위를 확보하는 것입니다. 이런 브랜드는 현재 기업에 많은 이윤을 가져다 주지는 않을지 모르지만, 발전 잠재력이 크며, 기업이 미래 시장에서 브랜드 경쟁에 참여할 수 있는 열쇠이자 희망이다. 이윤 브랜드는 기업의 다중 브랜드 경영의 중심이다. 이윤 브랜드가 기업에 이윤을 창출하는 것은 현대 브랜드 관리의 중요한 특징이다. 이익 브랜드는 일반적으로 기업 특유의 기술 (기업 핵심 경쟁력) 의 대표로, 단기간에 이 분야에 진입하여 기업을 위해 더 큰 이윤 공간, 심지어 초과이윤을 창출하기가 어렵다. 물론, 이런 브랜드는 업그레이드를 하지 않으면 쇠퇴기에 들어갈 수 있다. 변두리 브랜드는 기업의 다중 브랜드 경영 전략에 필요한 보완책이다. 변두리 브랜드는 기업의 이미지 브랜드나 경쟁 브랜드가 아니어서 외관상으로는 이윤을 창출하기 어렵지만, 특정 고객층이 있기 때문에 다른 브랜드처럼 높은 투자를 할 필요는 없다. 따라서 이 브랜드의 판매가 정체되거나 서서히 하락하더라도 충실한 소비자들은 이런 브랜드를 포기하지 않을 것이다. 변두리 브랜드의 역할은 잉여 자원을 만들어 기업의 경쟁 브랜드, 이미지 브랜드, 이윤 브랜드에 대한 자원 지원을 제공하여 기업의 고정 운영비를 상쇄하는 데 도움이 된다. 6. 그림의' 인수'? 추진 ",인수, 즉 (1) 인수 합병 (2) 도서 자료 취득 (도서 구매 및 교환 등을 통해. ); 얻은 책 (또는 신문과 잡지); (3) 습득 (지식, 기술 등. ). 예를 들어, 데이터? 수집은 데이터 수집을 의미합니다.
7. 그림의 "꽃"? 시뮬레이션', 번역자는 단지 글의 뜻에 따라' 비용 시뮬레이션' 으로 번역한다. Ask.com 검색 엔진에는 해당 내용이 없습니다. 사이트 팁은 꽃을 검색했습니까? Simulation, spent 는 노숙자와 가난한 사람들을 돕기 위해 비영리 단체가 시작한 대화형 게임입니다. 플레이어는 한 달 동안 65438 달러+0,000 원을 들여 가난한 사람들의 생활을 흉내냈다. 플레이어는 대화형 게임에 참여할 때 표지와 같은 많은 선택에 직면합니다. 저거요? 최저? 열어? 당신? 신용? 카드? 아니면? 지불? 저거요? 집세? 신용카드인가요, 집세인가요? 이 게임은 20 1 1 년 2 월 처음 개최됐으며 2 18 개국 200 만명이 400 여만 번 놀았다. 고객이 이러한 활동에 참여하면 신용 카드 연체 상환이 발생할 수 있습니다. 참조 링크: http://umdurham.org/? Https://en.wikipedia.org/wiki/spend _ (online _ game) # cite _ note-2
8, 데이터? 수요, 데이터 수요, 시장 관련? 수요, 생산? 제품 수요가 데이터 수요와 밀접한 관련이 있는 수요. 데이터 수요는 제품 비즈니스 논리에 따라 발전하기 때문입니다. 제품에 대한 데이터를 수집하려면 기능 간의 상호 작용, 개별 기능의 비즈니스 논리와 같은 제품의 비즈니스 논리를 이해해야 합니다. 둘째, 비즈니스 논리를 노드화하고, 중요한 노드를 식별하고, 우선 순위를 나열합니다. 셋째, 노드 기반 비즈니스를 인코딩하는 것은 주로 통계가 필요한 나열된 중요한 노드에 통계 이벤트와 매개변수를 추가하는 것입니다. 마지막으로, 데이터 요구 사항 문서가 형성됩니다.
9, 더? 자주? 비교? 자주
이 문장 를 보고 이 문장 을 번역해 데이터 분석사 가 두 가지 방면 에서 배울 수 있을 것 같다. 하나는 전통적인 경영 컨설팅 산업을 참고하는 것이다. DA 가 필요로 하는 기능에는 기존 컨설팅 업계의 문제 해결 능력과 데이터 처리 능력이 포함됩니다. 예를 들어 이 글의 두 번째 힌트는 컨설팅 업계의 중요한 방법인 구조적 사고와 비슷하다. 바바라 민토의' 논리' 를 참고할 수 있을까요? 네? 쓰기,? 생각? 그리고는요. 문제? Solving (중국어 번역: 금탑 원리-사고, 표현, 문제 해결의 논리), 이 책은 맥킨지의 고전 교육 교재로, 독자들이 사고와 표현에 명확하게 집중할 수 있도록 많은 실용적인 방법을 소개하고, 논리가 명확하고 초점이 명확하다. 둘째, 전통적인 데이터 자원 계획에서 영감을 얻을 수 있습니다. 이 문서의 세 번째 요점은 데이터 요구 사항을 결정하는 방법을 제안하고, 기존 데이터 자원 계획에서 비즈니스 요구 사항으로부터 데이터 요구 사항을 얻고, 비즈니스 및 데이터를 모델링하는 시스템 방법을 참조할 수 있으며, 특히 고부현 교수의 "정보 자원 계획: 정보화 건설의 기초 공사" 를 참조할 수 있습니다.
이 글은 마지막에 일과 휴식을 언급하는데, 사람마다 다르다. 나는 다음 사항에주의를 기울일 필요가 있다고 생각한다.
첫 번째는 종합적인 효율을 평가하는 것이다. 일주일에 한두 번, 효율성은 매우 높지만, 종합효율은 일주일 내내 안정된 리듬을 유지하는 것보다 못하다. 토마토 시계를 시간 관리 도구로 사용하여 자신의 상황을 정량적으로 분석할 수 있습니다.
두 번째는 생활 습관을 조절하는 것이다. 데이터 분석에는 충분한 정력이 필요하며, 과식과 같은 정력에 영향을 미치는 많은 요인들이 부정적인 영향을 미칠 수 있습니다.
세 번째는 호흡에주의를 기울이는 것입니다. 만약 우리가 효율적일 때 몸과 마음이 모두 편하고 호흡도 자연스럽다면, 이런 상태는 지속될 수 있다. 집중할 때 자주 숨을 참는다면, 이런 방식은 소비하는 경향이 있다. 명상과 정념 훈련이 도움이 될 수 있다.
일은 마라톤을 뛰는 것과 같다. 어떤 사람들의 목표는 빨리 달리는 것이 아니라, 60 세까지 달릴 수 있기를 바라며 오래 달리는 것이다. 이런 사람들은 속도를 높이는 것보다 심박수를 조절해야 한다. 어떤 사람들은 가능한 한 빨리 성적을 올리고 몇 가지 중요한 대회를 위해 스퍼트를 하고 싶어 자유 라디칼 증가의 대가를 자발적으로 부담한다. 데이터 분석도 마찬가지다. 어떤 목표를 설정했는지, 그럼 어떻게 달리는지.
변쇼가 공유하는 데이터 분석의 효율성을 높이는 8 가지 기술에 대한 내용입니다. 더 많은 정보는 글로벌 아이비리그가 더 많은 건품을 공유하는 것에 집중할 수 있다.