黄步添 刘琦 何钦铭 刘振广 陈建海

引用本文: 黄步添, 刘琦, 何钦铭, 刘振广, 陈建海. 基于语义嵌入模型与交易信息的智能合约自动分类系统. 自动化学报, 2017, 43(9): 1532-1543. doi: 10.16383/j.aas.2017.c160655
Citation: HUANG Bu-Tian, LIU Qi, HE Qin-Ming, LIU Zhen-Guang, CHEN Jian-Hai. Towards Automatic Smart-contract Codes Classification by Means of Word Embedding Model and Transaction Information. ACTA AUTOMATICA SINICA, 2017, 43(9): 1532-1543. doi: 10.16383/j.aas.2017.c160655


doi: 10.16383/j.aas.2017.c160655

    刘琦    新加坡国立大学计算机学院硕士研究生.主要研究方向为数据挖掘, 区块链.E-mail: leuchine@gmail.com

    何钦铭    浙江大学计算机科学与技术学院教授.主要研究方向为数据挖掘, 虚拟化, 区块链.E-mail: hqm@zju.edu.cn

    刘振广    新加坡国立大学计算机学院博士后.主要研究方向为数据挖掘, 区块链.E-mail: zhenguangliu@zju.edu.cn

    陈建海    浙江大学计算机科学与技术学院讲师.主要研究方向为虚拟化, 云计算, 区块链.E-mail: chenjh919@zju.edu.cn


    黄步添    浙江大学计算机科学与技术学院博士研究生.主要研究方向为虚拟化, 云计算, 区块链.本文通信作者, E-mail:butine@zju.edu.cn

Towards Automatic Smart-contract Codes Classification by Means of Word Embedding Model and Transaction Information

        Master student at the College of Computer Science, National University of Singapore, Singapore. His research interest covers data mining and blockchain

        Professor at the College of Computer Science and Technology, Zhejiang University. His research interest covers data mining, virtualization, and blockchain

        Postdoctor at the College of Computer Science, National University of Singapore, Singapore. His research interest covers data mining and blockchain

        Lecturer at the College of Computer Science and Technology, Zhejiang University. His research interest covers virtualization, cloud computing, and blockchain

    Corresponding author: HUANG Bu-Tian     Ph. D. candidate at the College of Computer Science and Technology, Zhejiang University. His research interest covers virtualization, cloud computing, and blockchain. Corresponding author of this paper, E-mail:butine@zju.edu.cn
  • 摘要: 作为区块链技术的一个突破性扩展,智能合约允许用户在区块链上实现个性化的代码逻辑从而使得区块链技术更加的简单易用.在智能合约代码信息迅速增长的背景下,如何管理和组织海量智能合约代码变得更具挑战性.基于人工智能技术的代码分类系统能根据代码的文本信息自动分门别类,从而更好地帮助人们管理和组织代码的信息.本文以Ethereum平台上的智能合约为例,鉴于词嵌入模型可以捕获代码的语义信息,提出一种基于词嵌入模型的智能合约分类系统.另外,每一个智能合约都关联着一系列交易,我们又通过智能合约的交易信息来更深入地了解智能合约的逻辑行为.据我们所知,本文是对智能合约代码自动分类问题的首次研究尝试.测试结果显示该系统具有较为令人满意的分类性能.
  • 图  1  Ethereum区块链

    Fig.  1  Ethereum blockchain

    图  2  系统框架

    Fig.  2  System architecture

    图  3  LSTM单元

    Fig.  3  LSTM unit

    图  4  标记流程

    Fig.  4  Mark process

    图  5  类别统计

    Fig.  5  Category statistics

    表  1  神经网络分类效果

    Table  1  Neural network classification effect

    PrecisionRecallAccuracyF1 scorePrecisionRecallAccuracyF1 score
    表  2  朴素贝叶斯分类效果

    Table  2  Naive Bayesian classification effect

    PrecisionRecallAccuracyF1 scorePrecisionRecallAccuracyF1 score
    表  3  支持向量机分类效果

    Table  3  Support vector machine classification effect

    PrecisionRecallAccuracyF1 scorePrecisionRecallAccuracyF1 score
