深度学习的编译优化方法师承程序语言,相比而言,程序语言的输入是语法树,深度学习的输入是计算图,有相似的编译结构,深度学习后端可以借鉴LLVM架构灵活支持新后端硬件。 不少社区都提出了自己的编译优化框架,定义了自己的一套中间表达(IR,Intermediate Represent),在发展过程中,这些框架和IR也...
图结构优化在算子层面调整图结构,调整前后的计算图输入输出等价。 # 方法 图层面优化主要包括: # 训练图清理 主要针对TensorFlow 1.x, Tensorflowd的训练图包含较多非推理用算子,通常调用TF提供的API提取子图,但可能因为用户的构图不当不能被清理干净。常见的操作包括: 固定输入Pla...
机器学习产品的基本功能,现状和趋势。 机器学习已经被广泛应用于推荐,风控,广告,搜索,图像,语音,文本等各个领域。机器学习系统也成为核心组件之一,用于建模,训练,预测的迭代流程。 # 功能 # 数据 负责数据的存储,清洗,标注,以及特征工程,使用SQL,pandas,scikit等工具分析数据分布,提取特征。 ...
推荐系统主要用来根据用户行为数据/用户特征实现个性化体验,行为预测,提高点击率/转化率等关键商业指标。 # 特征 数据很大程度上决定了模型的效果上限,通过特征工程构造合适的特征对效果有举足轻重的影响。 # 流程 推荐系统的功能模块主要包括: 召回 从全量候选物品中全选一小部分,规模在千/万级别。对运行速度要...
队列是线性结构,遵循FIFO原则。 # 基础 队列的底层可由数组或链表实现。 # 实践 # 单调队列求滑动窗口最大值 滑动窗口最大值 单调队列。单调队列的性质是维持有序序列,最值位于最头部,常用于不断有值替换(去除最久的,加入最新的)的场景中取最值。 # 最小k个数 暴力:排序 优先队列,最...
栈是线性结构,遵循FILO原则。 # 基础 栈的底层可由数组或链表实现。 # 实践 # 栈实现队列 用栈实现队列 查看队列首个元素时检查出栈是否为空,如果已排空,则将入栈元素依次压入出栈中 # 用队列实现栈 用队列实现栈 队列1记录,队列2备份,top/pop需要循环取出最近插入的值。也可...
Page 11 / 14