Skip to main content

Posts

Showing posts from May, 2013

Install Ant in Windows (reference)

Installing ANT for Windows 7 1.  Download ANT  http://ant.apache.org/ 2. Unzip it and rename it to ant 3.Set environmental variables   JAVA_HOME   to your Java environment,   ANT_HOME   to the directory you uncompressed , to do it on command prompt type this ( Assume Ant is installed in  E :\ant\ . ) set ANT_HOME=E:\ant set JAVA_HOME=D:\Program Files\Java\jdk1.6.0_03 set PATH=%PATH%;%ANT_HOME%\bin In windows 7 you can go to Control Panel\All Control Panel Items\System or right click on Computer and then to “Advance system setting” -Choose Advanced Tab -Press  Environtmen Variables Button - In the System Variables, click New Button Give the Variable Name: ANT_HOME Give the Value:  E:\ant Click OK Then,we’ll add new ANT_HOME path, And Click again on New Button if you do not have ‘path’ Variable in there, if so select it and edit as Give the Variable Name:path Give the Value  D:\Program Files\Java\jdk1.6.0_03\bin;%ANT_HOME%\bin Click OK

美国买房基本步骤

在美國買房子並沒有想像中的困難,因為所有的資訊都是公開透明的,網路上有很多有用的工具可以幫助你找到你關心的資訊,如果你人在美國,我甚至會建議你選定喜歡的區域後到 Redfin 訂閱每日通知信, RedFin 的更新速度非常快。看到喜歡的房子後,如果是 Open House ,你可以在他開放的時間帶著你的 Bank Statement , Pre-Approved Letter 去參觀房子,喜歡的話當場出價。不是 Open House 的話,你可以自己開車去看附近的環境,待售房屋的外面會有立牌寫著 Listing Agent (Seller Agent) 的電話,你可以自己打電話跟他約時間看房子,當然 .. 省事一點的話,你也可以透過 Buyer Agent 幫你處理這些事。如果你決定透過 Buyer Agent 買房子的話,請記得慎選有經驗好口碑和風評的 Agent ,有時候這是決定買家拿不拿得到房子的原因之一,買到房子並不是完全取決於出價數字,因為雙邊 Agent 都要等到房子交屋才能拿到佣金,賣方 Agent 和賣方往往會頃向和有經驗好口碑的 Agent 合作,以減少無法順利交屋的風險。以下是美國買屋的步驟,希望可以對大家有點幫助。 1. Loan Agent: 如果你要貸款買房,第一件事就是找貸款經紀人取得 ”Pre-approved letter” ,她會依照你提供的資料和信用分數告訴你可以貸款的金額,這個步驟要準備的資料如下 : 1.1 薪資單 1.2 頭期款  ( 如果頭期款還沒匯進美國,可以先出示在中國或台灣的存款,只要是英文版本就可以 ) 1.3 至少要有一次在美國報稅的紀錄 1.4 社會安全號碼  (SSN) 1.5 在美國所有的銀行帳號跟信用卡 1.6 如果不是綠卡或公民身分,就需要準備有效簽證 1.7 提供這些資料後,建議你保持現有的信用卡張數,也不要有新增的貸款,不然可能會拿到不好的貸款利率,甚至無法取得貸款 2. Buyer Agent /Seller Agent (Listing Agent) 2.1 Buyer Agent 扮演的角色主要是依照你的需求與預算列出你可能有興趣的房子,你經過篩選後,他會幫你打電話給 Seller Agent 預約看房子的時間 2.2 然後就是開車去看房子,看

Santa Cruz 好玩的地方

Santa Cruz 是一个很好玩的地方。Santa Cruz 离聖荷西不远。从聖荷西开车到 Santa Cruz 只要一个小时,开车要 Highway 280 S 再转入 Highway 17 S,只要四十分钟。Santa Cruz 有很多可以去看看的地方。Santa Cruz 的海边还有 Boardwalk , Roaring Camp , Mystery Spot 和 Monterey Bay Aquarium 。 在 Boardwalk 上有一个码头。在码头上有礼物店,糖果店,海鲜店和很多餐馆。在码头上可以钓鱼,看海师休息、租船去外海钓鱼,也可以去外海 观赏鲸鱼 和海豚。 Boardwalk 上,还有小孩子玩的游樂场和大人和小孩子都喜欢玩的电子逰戏机。 在 Roaring Camp 可以坐一个小时的蒸气小火车看几百年的红木,还有一种是坐露天小火车绕一圈Downtown 跟海边。另外还有一条小路很静,两边有很多红木。 还有一个很有意思的地方, Mystery Spot 。大家来 Santa Cruz 的话,记得一定要去看一看,很特别哦! Santa Cruz 离 Monterey Bay Aquarium 不远,从 Santa Cruz 可以去蒙特利海洋水族馆,多彩的海底世界。它是全球规模最大的海洋生態保育区之一。这兒水族馆临海而立,风景很美。 Original link: http://welcomesanjose.blogspot.com/2010/12/santa-cruz-beach-by.html

Machine learning tool collection (reference)

Wikipedia defines  Machine Learning  as “a branch of artificial intelligence that deals with the construction and study of systems that can learn from data.”   Below is a compilation of APIs that have benefited from Machine Learning in one way or another, we truly are living in the future so strap into your rocketship and prepare for blastoff. OCR recognition service  -  Ocrapiservice.com is an cloud based optical recognition engine. We take images as input and we reply with text as output. Checkout  http://ocrapiservice.com  to learn more. Face (Lambda)  -  A computer vision api for facial recognition and facial detection that is a perfect face.com replacement. We currently have a free api for face detection. Viralheat Sentiment  -  Viralheat sentiment is free API and allows users to submit short chunks of text for sentiment scoring. Chinese Analytics  -  Soshio allows companies to quickly expand their understanding of the Chinese market. Its Chinese Analytics API provides C

湾区 Dublin 和 Evergeen 买房 比较 (转)

我们2011-2012年两个地方都花过很大功夫看房子,最后选择了dublin。我们的情况是 :一人commute到南湾,大部分时间坐公司bus,一人wfh(去单位3-4次/月)。最后选 dublin的原因: 1。dublin房子比evergreen便宜 (同样大小,lot相似,年头相似的)。 2。我们当时比较喜欢evergreen的silver creek那一坨,但是那边的高中不如dublin high(虽然dublin high也不怎么样)。两边的小,中学都很好。 3。当时在evergreen看房子的时候有很多房子都是越南人的,在dublin的新区老中比较 多,我们倾向于住老中多的地方 4。dublin有两个bart站,去机场和sf城里比较方便。 5。dublin比较小,买东西更方便,大华99,target,基本的商店都在很近的地方, local路上的交通要比evergreen好一些。 6。两边对我的commute来说差不多。但是要承认的是从去年年底开始从南湾作班车去 tri-valley的时间要长了(因为路上traffic更糟),从tri-valley来南湾还和以前差 不多。 7。两边同样密密麻麻房子的地方(也就是我们可以买得起的地方),dublin可能因为 是新区吧,看上去要漂亮一些,我们在dublin ranch和positano转了几圈之后就喜欢上 了这里,landscaping做的很好,在小区里散步很愉悦,公园也比较多。 8。我们当时offer了几次evergreen的房子(resale),都被别的offer beat掉了,但是 又不想盲目加价bid up,觉得买resale的房子很麻烦,有很多其他不是自己可以控制的 因素决定你最后是不是能买得到。买新房比较省心,知道大概什么价钱,也没有 bidding war,等着release挑房子就好了,而且可以决定装修成自己喜欢的样子。 dublin当时有很多新区新房在卖,可挑选余地比较大。后来evergreen终于出新房子的 时候(chantrea at silver creek),欧的神啊,起价就1。28millon,我们买一样大 小一样规格的房子在dublin要少花30-40万。 9。evergreen的气候应该比dublin要好一些,tri-valley夏天比南湾热,冬天比南湾冷

转:关键词抽取(keywords extraction)的相关研究

现有上线的关键词提取算法 1. 语言特征+位置特征,如标题中的名词 2. 对正文+标题的文本构造PAT,然后从中计算字符串的左右熵,互信息来抽取关键词 参考论文《PAT-Tree-Based Keyword Extraction for Chinese Information Retrival》 《Updateable PAT-Tree Approach to Chinese Key Phrase Extraction using Mutual Information:A Linguistic Foundation for Knowledge Management》 这种方案的好处能抽出一些网络新词,性能比较好;但会引入一些噪音,召回率也不太理想 3. 网页特征:标题中存在特殊标记如《》或者“”等直接抽取出来,微博中存在## 4. 位置特征,候选关键词是否在标题,正文,还有meta data中出现过 存在问题 关键词抽取算法研究小结 关键词抽取特征 论文《Finding Advertising Keywords on web pages》中提到过的特征 1.语言特征 词性标注 2.首字母大写 3.关键词是否在hypertext里 4.关键词是否在meta data里 5.关键词是否在title里 6.关键词是否在url里 7.TF,DF 8.关键词所处位置信息 9.关键词所在句子长度及文档长度 10.候选短语的长度 11.查询日志 关键词抽取的特征选取 1.语言特征:使用POS(part-of-speech),标出词性。如名词、动词、副词、形容词等。 2.title : 该关键词是否出现在document中的标题里。 3.position : 该关键词在document中的位置,是否出现在整篇文章的首句、末句或段落的首句、末句等。《Automatic Keyword Extraction Using Linguistic Features》里面详细介绍了这种方法。 4.TF,IDF:最基本的信息权衡特征。 5.Named-Entity: 该关键词是否为命名实体,如人名、地名、机构名、专有名词、产品名。是否为日期信息,如年月日,时间等。 6.关键词之间关系:关键词之间的语义距离,是越大越好还是越小越好

java.lang.IllegalAccessError: tried to access method

Normally, this error is caught by the compiler; this error can only occur at run time if the definition of a class has incompatibly changed. So you'd better clean and rebuild your project to see what is gonna happen. Reference: http://stackoverflow.com/questions/7076414/java-lang-illegalaccesserror-tried-to-access-method