“明白。”
周一开盘,李松投入50万资金,买进了193200份红酒ETF。
几天后,因为过年,股市休市,单位也放假了。
李松告诉父母:单位里要赶项目,他过年就不回去了。
其实他很想回去探望一下父母,但是眼下他要全力以赴研发聊天机器人,实在脱不开身。
前几天每晚抽空编程,由于时间有限,进展不大。如今春节休假9天,正好可以集中精力搞开发。
说起这聊天机器人,第一步必须先把“分词”做好。
所谓分词,就是把一句话分割成一个个单独的词,这是后面正确理解句子含义的基础。
这个工作看似简单,其实也经常出错。
史上著名的那句“下雨天留客天留我不留”,就是一个令人抓狂的例子,不同的断句方法会导致完全不同的理解。
当然,这个例子有点极端,但现代生活中仍不乏引发歧义的句子,请看这句:今年我国取得辉煌科技成果。
经过分词处理应该变成:今年、我国、取得、辉煌、科技、成果。
可是,李松在一家新闻网站上看到这句话时,却变成了这个样子:
今年我国取得辉煌科技(8.14,+0.36%)成果。
这是怎么回事?原来,股市里刚好有一家名叫“辉煌科技”的上市公司,而这家网站大概是金融色彩浓厚,采取了股票名称优先的原则,因此分词的结果就成了:今年、我国、取得、辉煌科技、成果。
而其中的“辉煌科技(8.14,+0.36%)”表示最新的股价及涨幅。
像这种情况就是分词不当引起的,然而在新闻网站中却并不罕见。