'Research'에 해당하는 글 3건


iris.data



train.data


test.data


validation.data



iris 데이터 집합은 그 유명한 R. A. Fish가  1936년에 만든 것으로, 기계학습 데이터 저장소인 UCI Machine Learning Repository에서 가장 유명한 데이터 중에 하나이다. 워낙 오래 전에 만들어진 데이터라 전체 인스턴스 개수는 고작 150개 밖에 안되지만, 각 기계학습 알고리즘을 구현하거나 툴킷을 테스트하는 용도로는 충분해보인다.

이 데이터는 3종의 붓꽂에 대한 자질들로 구성되어 있고 각 자질은 소수점 1자리의 실수로 되어있어, 주로 분류 알고리즘을 테스트하는데 사용되다.


맨 위에 있는 iris.data가 UCI에 있는 원본 데이터이다. 파일의 각 라인이 하나의 인스턴스에 해당하며 처음 4개의 필드가 자질이고 마지막이 레이블에 해당한다. 자질의 구성은 다음과 같다.

  1. 꽃받침(sepal)의 길이
  2. 꽃받침의 넓이
  3. 꽃잎(petal)의 길이
  4. 꽃잎의 넓이

원본 데이터에서는 레이블이 문자열로 되어 있어 있다. 이것을 좀 더 다양한 툴킷에 적용할 수 있도록 정수형으로 변환하고, 레이블의 위치를 맨 앞 필드로 바꾼 것이 아래에 있는 train.data, test.data, validation.data이다.



'Research' 카테고리의 다른 글

[ML데이터] 붓꽃(Iris) 분류 데이터  (1) 2012.11.13
스타트업의 필수 작업 - 가설 수립과 검증  (0) 2012.06.21
걷기 명상  (0) 2012.03.05

WRITTEN BY
trowind
자연어처리, 프로그래밍, 여행, 음식, 삶의 기록

data, ML
트랙백  0 , 댓글  1개가 달렸습니다.
  1. Le PDG de la société suisse Monodor, Eric Favre, http://www.timberlandbaratas.com timberland, premier patron de Nespresso et inventeur des capsules éponymes, va lancer ses propres dosettes de thé, http://www.timberlandbaratas.com botas timberland, un marché en plein essor sur lequel Nestlé s'est engouffré en mai dernier, http://www.timberlandbaratas.com Mujer Timberland, a-t-on appris jeudi. Eric Favre, http://www.timberlandbaratas.com Timberland, inventeur en 1976 du concept de capsules à café Nespresso, qui ont fait la fortune de Nestlé, http://www.timberlandbaratas.com Hombre Timberland, va présenter mercredi à Pékin son nouveau concept de thé en dosettes baptisé "Tpresso", http://www.timberlandbaratas.com outlet timberland, selon un communiqué. Economie L'AMF accorde à Hermès sa dispense d'OPA Economie Boeing a livré 462 avions en 2010, moins que l'an dernierRelated articles:


    http://thequiett.tistory.com/233 La secrétaire indienne aux

    http://www.aettie.pe.kr/220 Le président du Nouveau Centre (NC) Hervé Morin "sera candidat" à la présidentielle de 2012
secret

오늘 트윗에 올라온 글들 중에서 흥미로운 것이 하나 있었다. 원본은 여기.

이 글에서 저자는 스타트업, 즉 새로운 기업을 만드는 작업이 가설 수립, 검증 작업이라고 설명한다. 이 글에서 가장 핵심이 되는 메시지를 인용해보자면,

스타트업은 생각보다 과학적인 프로세스입니다. 감으로 찍어서 올인을 하는 것이 아니라 내가 하려는 비즈니스의 시장, 소비자, 제품에 대한 나의 가설들을 수립하고 그 가설들 중에 가장 중요하고 불확실한 가설들을 순차적으로 하나하나 검증해나가는 과정입니다.


가 될 것이다.


가설 수립, 검증은 내가 대학원에 과정에서 계속 해왔고, 지금 회사에서도 계속 하고 있는 작업이기에 상당히 관심이 갔다. 가설 수립, 검증을 기업 활동 레벨에서 다룬 글을 처음 보느 것은 아니다. 하지만 스타트업을 준비하는 사람들이 이것의 중요성을 간과하기 쉽다는 점에서 창업을 준비하는 사람은 (그렇지 않은 사람 역시) 한번은 꼭 읽어볼만한 글이다.


나중에 기회가 되면 해당 글을 좀 더 분석, 정리해서 다시 포스팅을 해야겠다.

'Research' 카테고리의 다른 글

[ML데이터] 붓꽃(Iris) 분류 데이터  (1) 2012.11.13
스타트업의 필수 작업 - 가설 수립과 검증  (0) 2012.06.21
걷기 명상  (0) 2012.03.05

WRITTEN BY
trowind
자연어처리, 프로그래밍, 여행, 음식, 삶의 기록

트랙백  0 , 댓글  0개가 달렸습니다.
secret

걷기 명상

Research 2012. 3. 5. 19:19
 두세달 전부터 점심 식사 후에 회사 근처를 걷고 있다. 주로 코엑스 지하 상가쪽으로 가서 반디앤루이스 서점을 돌고 오기 때문에 산책이라 하기는 그렇고, 그냥 걷기라고 하는 것이 좋을 것 같다. 이걸 하면서 느낀 것은 식사 후에 바로 앉는 것보다 2~30분 걷는 것이 훨씬 건강에도 좋고 일의 능률도 오른다는 것이다. 꼭 한번 해보기를 권한다.

   걷기와 함께 힘들지 않고 꾸준히 하면 참 좋은 것 중에 하나가 명상이다. 명상은 예전에 단학 할 때 열심히(?) 하다가 최근에 다시 밤에 자기 전에 하고 있다. 우리나라 사람이라면 명상의 좋은 점에 대해 몇 번을 들었을 거라 생각되니 효능에 대해서는 패스. 그러다가 얼마 전에 (참 많은 일들이 얼마 전에 일어났네^^) 아래와 같은 글을 보게 됐다.
걸으면서 명상과 복식호흡을 병행한다. 생각을 가라앉히고 마음을 비우는 명상을 하면서 걸을 때는 복식호흡을 한다. 숨을 들이마시고 내쉴 때 호흡을 의식적으로 하면서 숨쉬기와 발걸음을 조화롭게 한다. 예를들어, 세 걸음 걸으면서 세번 숨을 들이마시고 세걸음 걸으면서 세 번 내쉬면 된다. 시선은 발의 2m 전방 바닥에 둔다. 발을 보면서 걸으면 발의 움직임 때문에 마음을 집중할 수 없고 목과 어깨가 긴장되기 때문이다. 팔은 자연스럽게 앞뒤로 흔든다. 
그렇게 복잡한 방법이 아니라 한번 해보면 좋을 것 같다. 다만, 복식 호흡을 제대로 배우지 않은 사람들은 주의했으면 한다. 복식 호흡이 단순히 배로 숨쉬는 것(?)이라 생각하고, 함부로 했다가는 예전의 나처럼 호흡이 흐트러지고 꽤 오랜 기간(길게는 몇 년)동안 고생하게 된다. 난 고등학교 때 친구가 복식호흡 한다고 해서 한동안 멋모르고 따라했다가 대학 생활 내내 고생했다. 물론 그 고생의 정도라는 것이 심한 것은 아니었지만, 집중해서 공부하려고 할 때 호흡이 가빠져서 힘들었던 적이 많다. 

  이야기가 옆길로 샜는데, 굳이 복식 호흡을 하려고 하지 말고 호흡과 걸음걸이를 일치시키면서 호흡에 집중하는 것이 중요하다. 복식 호흡인지, 가슴 호흡인지는 중요하지 않다. 평소보다 조금 느리게 숨쉬면서 발걸음을 호흡 박자에 맞추는 것이 더 중할 것 같다. 내일부터 직접 실습해보고 그 결과를 다시 포스팅해야겠다.

'Research' 카테고리의 다른 글

[ML데이터] 붓꽃(Iris) 분류 데이터  (1) 2012.11.13
스타트업의 필수 작업 - 가설 수립과 검증  (0) 2012.06.21
걷기 명상  (0) 2012.03.05

WRITTEN BY
trowind
자연어처리, 프로그래밍, 여행, 음식, 삶의 기록

트랙백  0 , 댓글  0개가 달렸습니다.
secret