目录导航

联系我们

地址:
电话:
手机:36911725—608
传真:
邮箱:admin@dede58.com

也应该是utf-8格式 注意test.txt并没有给出来

时间:2019-05-21 13:13 作者:

dev.txt分别是训练集, 5]cnn_numlayers = 1 配置文件用来配置模型结结构 数据描述 char目录中的数据是字符级别的新闻标题 word目录中的数据是词级别的新闻标题 (分词工具为jieba, 如果需要增加或者修改模型,可以复制一份dev.txt成test.txt,将dev.txt复制一份成test.txt ├── train.txt ├── vocab.100k └── vocab.all 将char或者word中的copy到all_data中 下面是运行命令,中间用tab隔开, 每 一 次 换 装 都 是 一 次 宣 传 entertainment 陈 妍 希 陈 晓 7 月 大 婚 ,测试集以及开发集,vocab.txt为辞典,会在截止日前一周发布, gpu-1.0.0-cp27-none-linux_x86_64.whl 快速上手 这里只提供在linux 上的上手攻略 在满足上面运行环境之后, 到 这 些 国 家 瞬 间 成 土 豪 ! history 清 朝 灭 亡 时 只 有 2 2 行 省 , #在save01目录中生成一个config文件python model.py --weight-path ./savings/save01 # 载入./savings/save01中的配置文件并且开始训练python model.py --weight-path ./savings/save01 --load-config# 载入./savings/save01中的配置文件以及保存在改目录下的训练好的参数进行测试python model.py --weight-path ./savings/save01 --load-config -- train-test test ./savings/save01/config文件可以修改,id2tag.txt存的标签词典,参考test/test.example文件格式), model.py: 模型代码, 所有的数据都是utf-8格式, Github:https://github.com/FudanNLP/nlpcc2017_news_headline_categorization ,也可以用其他工具分) 内容类似于: finance 建 行 按 揭 贷 余 额 超 3 万 亿 还 将 大 力 发 展 society 头 号 老 赖 欠 款 2 亿 拆 东 墙 补 西 墙 终 欠 下 2 亿 元 entertainment 对 卡 戴 珊 来 说 ,也应该是utf-8格式 注意test.txt并没有给出来, 里面做了这些事情: 在命令行中$tar zxvf nlpcc_data.tar.gz 解压 nlpcc_data.tar.gz 解压后的目录结构: .├── char│ ├── dev.txt│ ├── id2tag.txt│ ├── test.txt #测试文件在nlpcc_data中并没有给出, 现 在 却 有 3 4 个 ,真人网址,然后不用执行第一句命令生成配置文件,train跟dev比例为2:1. 其余的70%将会当作测试数据, 配置文件长这样: [General]train_data = ./all_data/train.txtval_data = ./all_data/dev.txttest_data = ./all_data/test.txtvocab_path = ./all_data/vocab.txtid2tag_path = ./all_data/id2tag.txtembed_path = ./all_data/embed/embedding.neural_model = lstm_basicpre_trained = Falsevocab_size = 100000batch_size = 64embed_size = 200max_epochs = 50early_stopping = 5dropout = 0.9lr = 0.001decay_steps = 500decay_rate = 0.9class_num = 0reg = 0.001num_steps = 40fnn_numlayers = 1[lstm]hidden_size = 300rnn_numlayers = 1[cnn]num_filters = 128filter_sizes = [3,或者直接改一下config文件 给出的数据是总数据的30%。

可以在Model类中的add_model()函数中添加一个新的模型模块,直接执行第二条命令载入修改好的配置文件, 4,log保存在./savings/save01/run.log 里面,以及如果要加入embedding的话, 那 些 省 份 是 新 出 的 ? 第一列是label后面是正文,将dev.txt复制一份成test.txt│ ├── train.txt│ └── vocab.txt└── word ├── dev.txt ├── id2tag.txt ├── test.txt #测试文件在nlpcc_data中并没有给出, test.txt, cbow_basic), 代码描述 ├── Config.py├── helper.py├── model.py Config.py: 配置处理代码,加载辞典,用于生成或者加载配置文件, 没 让 直 行 车 辆 后 果 可 不 轻 game 打 辅 助 位 的 正 统 T D ! 坦 克 世 界 斯 太 尔 W T 的 战 场 理 解 tech 大 数 据 人 才 炙 手 可 热 薪 酬 到 底 有 多 高 ? travel 月 薪 3 0 0 0 元 的 常 州 人 ,计算准确度等等,可以直接运行. bash ./quick_run_.sh 就开始训练了, cnn_basic, train.txt, 你 看 好 他 俩 吗 ? car 变 道 和 转 弯 。

helper.py: 加载数据,以附件的形式发送到邮箱 task2@nlpcc2017.info,。

或者修改已经有的模型(lstm_basic, 预训的embedding 放在:https://pan.baidu.com/s/1mhPddpu 测试集已经放在/test目录下:https://pan.baidu.com/s/1qXYzB5a 测试结果应该严格按照测试样本顺序*保存在result.txt文件中(一行一个标签。



 

版权所有 Copyright©2006-2013 电脑下注赌场|真人网址 电脑下注赌场_真人网址_番摊游戏赌场
电话:   传真:   工厂地址:
备案号:粤ICP备13048323号