What is Association Analysis? 

 Association analysis uses a set of transactions to discover rules that indicate the likely occurrence of an item based on the occurrences of other items in the transaction

Association Rule

An implication expression of the form X ® Y, where X and Y are item sets

Example:    {Milk, Diaper} -> {Beer}

Here X is {Milk, Diaper] -> Y which is {Beer}

 

TIDItems
1Chips, Milk
2Chips, Diaper, Beer, Cornflakes
3Milk, Diaper, Beer, Pepsi
4Chips, Milk, Diaper, Beer
5Chips, Milk, Diaper, pepsi

 

Association Rule Evaluation Metrics

Support (s) = Fraction of transactions that contain both X and Y i.e. how often Milk, Diaper and Beer occur together in the transactions. Milk, Diaper and Beer occur in 2 out of total 5 transactions, hence support =2/5=0.4

Confidence (c) = Measures how often each item in Y appears in transactions that contain X

C= Support (X + Y)/Support (X)

That is- How often beer occurs in the transactions which contain milk and diaper. Now milk and diaper are together in 3 transactions (TID=3, 4 and 5), and out of the 3, beer is present in 2 of them, hence confidence = 2/3 (No. of transactions with Milk, Diaper and Beer/No. of transactions with Milk and Beer) =0.67

Lift: The Lift of the rule is X=>Y is the confidence of the rule divided by the expected confidence, assuming that the item sets are independent.

 Interpretation of Lift:

A lift value greater than 1 indicates that X and Y appear more often together than expected; this means that the occurrence of X has a positive effect on the occurrence of Y or that X is positively correlated with Y.

A lift smaller than 1 indicates that X and Y appear less often together than expected, this means that the occurrence of X has a negative effect on the occurrence of Y or that X is negatively correlated with Y

A lift value near 1 indicates that X and Y appear almost as often together as expected; this means that the occurrence of X has almost no effect on the occurrence of Y or that X and Y have Zero Correlation. Thus, lift is a value between 0 and infinity

For all the values of lift which are > 1, actual lift= Lift value-1 and 

% Increase in those cases = (Lift value-1)*100

Coming back to our Example-> Lift (X->Y) = confidence(X->Y) / support(Y)

=Support (X+Y)/Support (X)*Support (Y)

= 0.67 / (3/5)=0.67/0.60 = 1.1167

 Now, Let us do a bit of Math here-> ((0.67-0.60)/0.60)*100=70/6=11.67 i.e. probability of finding beer in the transactions which have Milk and Diaper is greater than the normal probability of finding Beer in the above 5 transactions by 11.67%.

 How? Let’s solve further

 Probability= Favorable Number of Cases/Total Sample Space

Probability of finding beer in the above 5 transactions=3/5=0.60

Probability of finding beer in the transactions which have milk and diaper

Favorable Cases= Beer + Milk + Diaper

Sample Space=Milk + Diaper

=number of transactions which have Beer with Milk and Diaper/number of transactions which have

Milk and Diaper=2/3=0.67. Now 0.67 is 11.67% more than 0.60 i.e. there is a lift or increase of 11.67% of finding beer in the transactions which have Milk and Diaper

To Summarize:

Support: The support of the rule, that is, the relative frequency of transactions that contain X and Y.

                  Support(X->Y) = support(X+Y)

Confidence: The confidence of the rule.  Confidence(X->Y) = support(X+Y)/ support(X)

Lift: The following equation must hold true.  Lift (X->Y) = confidence(X->Y) / support(Y)

          =Support (X+Y)/Support (X)*Support(Y)

 Support of the Rule X=>Y is Symmetric i.e. Support (X->Y) = Support (Y->X)

Lift of the Rule X->Y is Symmetric i.e. Support (X->Y) = Support(Y->X)

 

Drawback of Confidence:

Confidence can sometimes by misleading as is shown in the below example

 Credit Card 
Saving’s Account NoYesTotal
No50350400
Yes100500600

 Rule: S=>C (People with Savings Account are likely to have a credit card)

The interpretation of implication (=>) in association rules can sometimes be misleading

As in Above: Support (S=>C) =500/1000=50%

Confidence (S=>C) = 500/600=83%

Expected Confidence (S=>C (=350+500)/1000) = 85%

Lift (S=>C) = 0.83/0.85 < 1

Based on the Support and Confidence, it might be considered a strong rule. However, people without a savings account are even more likely to have a credit card (=350/400=87.5%).

Savings Account and Credit Card are in fact found to have a negative correlation. Thus, high confidence and support does not imply cause and effect, the two products at times might not even be correlated.

One has to exercise caution in making any recommendations in such cases and look closely at the lift values.

Possible Recommendations for X=>Y Rule (Where X and Y are 2 separate Products and have high support, high confidence and high positive lift > 1)

  1. Put X and Y Closer in the Store
  2. Package X with Y
  3. Package X and Y with a poorly selling item
  4. Give Discount on only one of X and Y
  5. Increase the Price of X and lower the price of Y (or vice versa)
  6. Advertise only one of X and Y i.e. do not advertise X and Y together
  7. Example: If X was a toy and Y a form of sweet, then offering sweets in the form of toy X could also be a good option.

  Example: Interpretation of Rules for a sample product transaction set:

The thresholds used were 1.5 % support and 20% confidence.

 

Product1

==>

Product2

Support (%)

Confidence (%)

Lift

 P

==>

Q

2.18

26.33

1.49

R

==>

Q

1.50

23.82

1.35

 S

==>

Q

2.42

23.45

1.33

T

==>

U

1.79

21.06

1.23

 Interpretation of the first Rule:

Products P and Q together appear in 2.18 % of the transactions as indicated by Support.

If there are 100 transactions that contain Product P, then 26 of those also have Q as indicated by the Confidence.

There is 49% more chance of occurrence of Q, given that P is also there as is indicated by the Lift.

Or The Probability of finding Q in all those transactions which have Product P is 49% more than the Probability of finding Product Q in all the transactions

 Mathematics behind the Rule (Ex B->C):

Lift= Support of (B + C)/ Support (B)*Support (C) = approx 50%

 The Way Lift has been calculated is as below:

Say for Example if total transactions are 100

C is present in 25=> Probability of finding C in transactions=25/100=1/4=0.25

B is present in 50, but C is present with B in 25 of them. So Probability of finding C in all the transactions with B is = B + C together/ B alone = 25/50=0.50

It implies that Probability of Finding C in all the transactions with B is double the probability of finding C alone in all the transactions

Example: Interpretation of Rules for a sample Product by region transaction set

Summary of association rules: Min: support = 2.0%, confidence = 20.0%

Max. Size of an Item Set = 10

Support: Fraction of transactions that contain both X and Y. The threshold has been kept at 2% i.e. atleast 2% of the transactions contain both X and Y.

Confidence (c): Measures how often each item in Y appears in transactions that contain X. The threshold has been kept at 20%.

 

Item Set 1 ( X )

==>

Item Set 2 ( Y )

Support (%)

Confidence (%)

Lift

A1

==>

P1

3.61

88.91

19.41

A2

==>

P2

1.99

65.89

15.11

Consider the top rule:

Let X= A1 (Region)

Let Y= P1 (Product)

Why the values for Support are same? -> It is just a simple mathematical formula

Support = Transactions that contain both X and Y/Total Transactions

Since for both the rules X and Y are same, just that their orientation is different, obviously for both the rules it comes 3.61% i.e. 3.61% of the transactions contain both X & Y

Interpretation of the Confidence Value:

X=>Y, confidence = (X Union Y)/X i.e. Support (X+Y)/Support (X)

88.91% of the times, Product P1 occurs in all those transactions which contain A1 as the region.

Say for example there are 100 transactions which contain region- A1, among them 89 transactions contain the Product P1

Interpretation of the Lift value:

Lift (X->Y) = confidence(X->Y) / support(Y) =Support (X+Y)/Support (X)*support (Y)

For this Rule => probability of finding Product1 increases 18.4 times in all those transactions where region is A1

Or

Probability of P1 in all those transactions which have region A1 is 18.4 times the Probability of Product P1 in all the transactions.

Mathematics behind the Rule (Ex T->S): 

Say for Example if total transactions are 100

S is present in 20=> Probability of finding S in transactions=20/100=0.20

T is present in 50, but S is present with T in 20 of them. So Probability of finding S in all the transactions with T is = T + S together/ T alone = 20/50=0.40

It implies that Probability of finding Product S in all the transactions with region T is double the probability of finding S alone in all the transactions


From : http://analyticstrainings.com/?p=151

저작자 표시 비영리 변경 금지
신고

WRITTEN BY
빅터크룸
머 먹고 사냐.....

받은 트랙백이 없고 , 댓글이 없습니다.
secret

스타트업(초기기업)이 성공하는 길은 단순하다. 소비자에게 호응을 얻으면 된다. 하지만 동업자, 경영전략 등 스타트업 내부요인으로 실패하는 경우도 많다. 미국 유명 스타트업 육성 기관인 와이콤비네이터(Y-Combinator) 창업자 폴 그레이엄(Paul Graham)의 제안은 참고할 만하다.


1. 좋은 동업자를 찾아라.

스타트업이 스스로 무너지는 이유 중 하나는 동업자를 잘못 구했을 때다. 학교나 직장 등 돌아갈 곳이 있는 사람들은 동업자로 적절하지 않다. 이들은 오로지 스타트업을 위해 집중하지 않아도 아쉬울 게 없다. 스타트업 성장에 전력을 다할 수 있는 좋은 동업자를 찾아야 한다.


2. 제품‧서비스는 빨리 출시하자.

되도록 빨리 제품‧서비스를 출시하는 것이 좋다. 유사한 서비스가 넘쳐나는 시대다. 해당 시장에 먼저 뛰어들어 선점하는 전략이 필요하다. 완벽한 서비스 개발에만 몰두하다가는 고객들을 모두 빼앗길 수 있다.


3. 아이디어를 계속 발전시키자.

성공한 스타트업 대부분은 아이디어를 지속적으로 발전시켰다. 대표적인 곳이 금융과 IT(정보기술)을 결합한 핀테크의 선두주자 페이팔이다. 애초 90년대 개인용 휴대 단말기 팜파일럿(초창기 PDA 제품)끼리 돈을 송금할 수 있는 서비스를 선보였다가 현재 이메일을 통한 대금 결제 시스템으로 진화했다.


4. 고객 입장에 서자.

시장에서 필요로 하는 서비스를 개발해야 한다. 고객의 불편함을 개선 시키는 서비스일수록 빠르게 성장할 수 있다. 이를 위해선 고객의 입장에서 생각할 줄 알아야 한다.


5. 실제 고객을 만족시키자.

자신과 가까운 사람들에게 자사 서비스가 어떠냐고 물어보면 대부분 '좋다'고 대답할 것이다. 하지만 이들은 고객이 아니다. 자사 서비스에 시간과 돈을 쓸 의사가 있는지 물어봤을 때 '그렇다'고 대답한 사람들만이 고객이다. 단순한 칭찬에 현혹되지 말고 실제 고객을 만족 시킬 수 있어야 한다.


6. 초기 고객을 VIP로 대우하자.

초기 고객은 당신의 서비스를 맨 처음으로 인정해준 사람들이다. 그들의 시간을 투자했다는 점에서 고객 역시 투자자와 같다. 따라서 그들로부터 피드백을 받고 할 수 있는 최고의 서비스를 제공할 수 있어야 한다.


7. 무엇을 성장지표로 삼을지 정하자.

간혹 매출액 대신 매출 성장률만 공개하는 스타트업이 있다. '매월 매출 성장률 200%'는 근사해보이지만 매출 100만원에서 300만원으로 근소하게 성장한 것일 수 있다. 이는 눈속임에 불과하다. 따라서 스타트업의 진정한 성장지표를 무엇으로 할지 스스로 정할 필요가 있다.


8. 투자금은 투자자의 돈이다.

스타트업은 최대한 가난하게 운영해야 한다. 아무리 많은 규모의 투자를 유치했더라도 말이다. 이익이 나지 않는 상태라면 더욱 지출을 최소화해야 한다. 투자금은 투자자의 몫이다. 자신의 돈으로 착각해선 안 된다.


9. 아무리 적어도 매출 발생은 좋은 징조다.

매출이 발생한다는 것은 큰 의미가 있다. 고객이 돈을 내고 스타트업의 서비스를 사용할 만한 가치를 느낀다는 뜻이기 때문. 스타트업이 살아남을 수 있다는 좋은 징조이기도 하다.


10. 방해요소를 제거하자.

스타트업의 목적은 단 한가지, 고객에게 서비스를 제공하는 것이다. 서비스 개발 외에 모든 활동, 예컨대 투자유치 활동까지 모두 방해요소다. 목적에 집중해야 한다는 의미다.


11. 묵묵히 걸어가자.

고객과 파트너, 투자자 등 스타트업에게 먼저 관심을 가져주는 경우는 거의 없다. 그저 고객이 원하는 서비스를 개발할 때까지 묵묵히 걸어가는 수밖에 없다.


12. 포기하지 말자.

신뢰를 얻는 방법은 지속적으로 성장하는 길뿐이다. 창업자가 포기하면 모든 것은 끝날 수밖에 없다.


13. 투자유치에 실패할 수도 있다.

투자자가 투자를 결정했다고 안심하거나 들떠있지 말아야 한다. 투자금이 입금되기 전까지 확정된 것이 아니기 때문이다. 투자자는 얼마든지 마음을 바꿀 수 있다. 언제든지 투자유치에 실패할 수 있음을 알고 지속적으로 설득해야 한다.




출처 : http://zum.com/victor8481#!/v=2&tab=it&p=10&cm=newsbox&news=0112015042121385167

저작자 표시 비영리 변경 금지
신고

WRITTEN BY
빅터크룸
머 먹고 사냐.....

받은 트랙백이 없고 , 댓글이 없습니다.
secret

인간은 시각, 청각, 후각, 촉각 등 수많은 자극들을 감각기관에 의해 감지하지만 모든 자극들을 다 받아들이지 못하고 특정의 자극만을 선택하여 체계화 하고 해석하며 거기에 의미를 부여하게 된다. 

이러한 과정에서 자극을 받아들이는 사람의 욕구, 감정 등에 의하여 또는 자극 자체가 갖는 특성이라든가 자극의 크기, 강도, 신기함, 반복 등에 의해서 자극을 선택하여 지각(知覺)한다는 것이다. 

그런데 이와 같은 지각과정에서 외부로부터 자극을 객관적으로 수용하여 정확하게 해석하지 못하는 오류를 범하는 경우가 많다. 개인 자신의 관심과 배경, 경험 및 태도에 의한 영향을 받아 판단하는 선택적 지각, 후광효과, 스테레오타이핑 오류(상동적 태도) 등을 들 수 있는데. 


스테레오타이핑은 

타인을 평가할 때 경직된 편견을 가지고 그가 속한 사회적 집단, 예컨대 지역, 종교, 성(性), 연령 등에 따라 평가를 함으로써 잘못을 범하는 경우를 말한다. 

저작자 표시 비영리 변경 금지
신고

WRITTEN BY
빅터크룸
머 먹고 사냐.....

받은 트랙백이 없고 , 댓글이 없습니다.
secret

Southwest Airlines는 1971년 Dallas에서 보잉 737기로 Texas의 몇몇 도시 사이를 연결하는 작은 회사로 출발했으며, 이후 국내 항공시장에서 경쟁사에 비해 월등히 낮은 비용과 turnaround rate(다음 비행까지 걸리는 시간)의 실현, 실속 있는 서비스를 바탕으로 고객의 부담을 크게 줄이는 데 성공했다. 이는 곧바로 시장 점유율의 급속한 상승과 순이익의 증대로 이어졌다. 한편, Southwest Airlines의 성공과는 달리 파산과 노사분규, 수익성 악화, 인수 합병 등의 문제가 이어졌던 경쟁사들(Continental, United Airlines)은 Southwest Airlines로부터 빼앗긴 시장 점유율을 다시 찾기 위해 국내 저가 항공시장에 뛰어들기 시작했고, Kiwi나 Reno등의 신규 항공사 역시 시장에 참여하면서 현재 시장은 매우 복잡한 상황이다. 그럼에도 불구하고 Southwest Airlines은 경쟁사에 비해 높은 경쟁우위를 유지하고 있다. 그 이유는 무엇일까?

Southwest Airlines는 설립 당시 경쟁사였던 Continental의 견제로 인해 원활한 비행과 고객 유치에 어려움을 겪었다. 그러나 이러한 견제가 오히려 경쟁을 위한 호재로 작용해, 이후 Southwest Airlines는 틈새시장을 공략하는 독특한 마케팅을 통해 고객의 시선을 끄는 데에 성공한다. 80년대 중반 USAir과 American Airlines에 합병된 Southwest Airlines은 이들 기업이 철수한 적자노선에 진입함으로서 California로 시장을 넓힐 기회를 얻는다. 1989년, 0%의 시장 점유율로 사업을 시작한 Southwest Airlines은 93년 California의 10개 도시에서 70%의 시장 점유율을 기록하게 된다.

기업 설립시기부터 Southwest Airlines는 같은 전략과 운영 스타일을 지금까지 고수해 오고 있다. 일단 그들은 주로 도심과 가까우면서도 활용도가 낮은 공항에서 기항한다. 또한 유류비가 적게 드는 보잉 737기만을 사용함으로서 기종의 다양함이 불러오는 운영의 복잡함을 제거한다. 이를 통해 타사에 비해 월등히 높은 경쟁력을 제고하는 데 성공했으며, 이는 곧 저렴한 단가의 유지로 이어진다. 순수 비행시간의 평균이 65분일 정도로 가까운 도시 간의 영업에 주력하며, 중간 경유는 하지 않는다. 또한 turnaround rates를 단 15분으로 줄이면서 경쟁사에 비해 더 많은 비행 횟수와 수송량을 가능케 했다. 이러한 경쟁력은 비단 항공 업계 내부에서만 독보적인 것은 아니며, 저렴한 단가와 간단한 서비스가 오히려 타 교통수단의 고객을 이끄는 결과를 낳았다. 자동차와 비행기 중 선택을 고민하는 여행객을 고객으로 이끌게 된 것이다. Southwest Airlines가 진출하기 전 매주 항공기 이용량이 주당 8,000명에 불과했던 곳이 진출 이후 주당 26,000명으로 크게 증가한 것이 좋은 예라고 할 수 있다. 또한 그들의 단가 정책은 매우 단순하다. 경쟁사들이 수익 극대화를 위해 다양한 요금제와 복잡한 컴퓨터 프로그램을 사용하는 반면, Southwest Airlines는 단 두 가지의 요금제만을 사용하며, 마일리지도 거리 비례가 아닌 횟수 비례이다.

이러한 경쟁 우위는 어디에서 구현되는 것일까? 가장 쉽게 눈에 띄는 Southwest Airlines의 우위는 그들의 비용구조이다. 승객 일인당 비용을 단 7센트에 묶는 데 성공했으며, 이는 타사에 비해 훨씬 낮은 수치이다. 그리고 이러한 우위는 대부분 Southwest 임직원들의 뛰어난 생산성에 기인한다. 그들은 보다 낮은 비용을 위해 기꺼이 고객과 동료를 돕고, 업계 평균 비행시간보다 더 많이 일한다. 이를 통해 Southwest Airlines는 타사에 비해 낮은 단가와 동시에 뛰어난 서비스를 제공하는 데 성공했다. 이러한 인적 자원의 우수성은 회사 내의 문화와 연관되어 있다. CEO인 Herb Kelleher는 회사 광고에도 출연하고, 시간을 막론하고 직원들의 의견을 경청하는 등 동종 업계의 CEO와는 다른 인간 친화적인 모습을 지니고 있다. 그의 이러한 자세는 회사의 문화에 큰 영향을 주었다. Southwest Airlines의 문화는 ‘인간적이며, 가족적인 문화’로 요약될 수 있다. “Southwest에서 일하는 사람은 Southwest를 business로 생각하지 않는다. 그들은 ‘Crusade’를 생각한다”는 말은 그들의 문화와 정신을 단적으로 보여준다. 이러한 문화가 꾸준히 이어지는 데에는 Southwest가 줄곧 추구해 온 인적 자원에 대한 애착과 투자에서 기인한다.

Southwest는 직원 선발부터 타 기업과 다른 모습을 보인다. 엄청나게 많은 지원서를 받고, 그들 중 인터뷰를 통해 소수만을 채용한다. 이들이 인터뷰에서 중점을 두는 것은 ‘교육을 통해 바뀔 수 있는 기술’이 아닌, ‘태도’이다. 인터뷰에는 동료 직원, 심지어는 고객까지 참여하며 이를 통해 Southwest Airlines의 문화에 맞는 인재를 채용하고 있다. 또한 직원들을 위한 Training도 이루어진다. “우리의 내부 서비스 수준은 외부 서비스 수준과 같다”는 한 직원의 말처럼 갓 입사한 직원들, 매니저들, 간부들을 위한 Training은 계속 이어진다. 이는 기업 문화의 전승과 함께 중요한 ‘쌍방향 의사소통’의 기회로도 작용한다. Southwest의 파일럿들은 타사의 파일럿에 비해 많은 일을 하면서도 보수는 적다. 이는 다른 Southwest 직원들도 마찬가지이다. 그럼에도 불구하고 이직율은 동종 업계 중 최저를 기록한다. 여기에는 직원들을 위한 ‘수익 공유’ 프로그램이 중요한 역할을 한다. Southwest 의 보상 프로그램은 기본적으로 연공서열뿐이지만, 이익공유를 통한 보너스와 직원용 주식 구매 프로그램 등으로 임금 이외의 수익을 보장한다. CEO Herb Kelleher의 적은 보수와 직장 내 팀워크 문화 역시 긍정적인 요인 중 하나이다.

Southwest의 성공에 시장을 잠식당한 Continental과 United Airlines는 Southwest의 기존 사업 분야인 국내 저가 항공시장에 뛰어들었다. 여기에는 단순한 비용 절감 뿐만이 아닌 Southwest의 작업 방식과 기업 이념도 도입되어 일종의 ‘선전포고’라는 느낌을 주었다. 그러나 결과는 그들의 패배로 이어졌다. 급작스런 이종 문화의 도입은 전체적인 경쟁력 저하라는 결과를 불러왔으며, 예상보다 저조한 수익을 올리는 데 그쳤다. 기업의 근본적인 문화의 개선 없이 외부의 사례를 도입하는 것에는 문제가 뒤따를 수 밖에 없다는 사실을 여실히 보여주는 사례라 할 수 있다.

그러나 Southwest Airlines의 성공이 언제까지나 이어질지는 알 수 없다. Texas의 작은 항공사에서 출발한 Southwest는 현재 14,000명의 직원을 거느리고 있으며, 이는 조직 문화의 계승에 많은 부담을 주는 요인이 되고 있다. 또한 그간의 성공이 임직원들의 자만을 불러올 수도 있으며, 이 역시 위험 요인 중 하나이다. 탁월한 직원 생산성을 통해 발현된 Southwest의 성공은 기업 문화를 바탕으로 하고 있으며, 기업 문화가 흔들린다면 그들의 성공 역시 장담할 수 없다. 거대기업으로서의 부정적 문화가 팽배한 United Airlines가 체질 개선에 실패한 최근의 사례는 Southwest에게도 좋은 교훈이 될 것이다.


http://cafe.daum.net/_c21_/bbs_search_read?grpid=1PhAR&fldid=2FE3&datanum=27

저작자 표시 비영리 변경 금지
신고

WRITTEN BY
빅터크룸
머 먹고 사냐.....

받은 트랙백이 없고 , 댓글이 없습니다.
secret