期刊文献+
共找到11,064篇文章
< 1 2 250 >
每页显示 20 50 100
基于兴趣函数的多样化Option-Critic算法
1
作者 栗军伟 刘全 +1 位作者 黄志刚 徐亚鹏 《计算机研究与发展》 EI CSCD 北大核心 2024年第12期3108-3120,共13页
Option框架作为分层强化学习的一种常用时序抽象方法,允许智能体在不同的时间尺度上学习策略,可以有效解决稀疏奖励问题.为了保证Option可以引导智能体访问更多的状态空间,一些方法通过引入基于互信息的内部奖励和终止函数来提升Option... Option框架作为分层强化学习的一种常用时序抽象方法,允许智能体在不同的时间尺度上学习策略,可以有效解决稀疏奖励问题.为了保证Option可以引导智能体访问更多的状态空间,一些方法通过引入基于互信息的内部奖励和终止函数来提升Option内部策略的多样性.但这会导致算法学习速度慢和内部策略的知识迁移能力低等问题,严重影响了算法性能.针对以上问题,提出基于兴趣函数优化的多样化Option-Critic算法(diversity-enriched Option-Critic algorithm with interest functions,DEOC-IF).该算法在多样化Option-Critic算法(diversity-enriched Option-Critic,DEOC)的基础上,通过引入兴趣函数约束上层策略对Option内部策略的选择,既保证了Option集合的多样性,又使得学习到的内部策略可以关注状态空间的不同区域,有利于提高算法的知识迁移能力,加快学习速度.此外,DEOC-IF算法引入一种新的兴趣函数更新梯度,有利于提高算法的探索能力.为了验证算法的有效性和知识迁移能力,分别在4房间导航任务、Mujoco和MiniWorld实验环境中,将DEOC-IF算法与其他最新算法进行对比实验.结果表明,DEOC-IF算法具有更好的性能优势和策略迁移能力. 展开更多
关键词 强化学习 时序抽象 option框架 兴趣函数 option-Critic算法
下载PDF
弹性退休制度下谁更愿意延迟退休?——基于Option Value模型的微观模拟
2
作者 郭秀云 李悦心 《人口与发展》 CSSCI 北大核心 2024年第4期132-144,共13页
人口老龄化背景下延迟退休年龄、建立弹性退休制度是大势所趋。养老金激励是弹性退休制度的重要内容。建立期权价值模型和养老金给付及奖惩因子模型,基于中国家庭收入调查项目(CHIP2018)的数据,对不同特征人群的养老金峰值、期权价值、... 人口老龄化背景下延迟退休年龄、建立弹性退休制度是大势所趋。养老金激励是弹性退休制度的重要内容。建立期权价值模型和养老金给付及奖惩因子模型,基于中国家庭收入调查项目(CHIP2018)的数据,对不同特征人群的养老金峰值、期权价值、内部报酬率进行模拟。研究发现:养老金总财富随退休年龄“先增后减”,男性的峰值年龄早于女性;引入养老金“奖惩”机制有助于提高最优退休年龄,激励劳动者延迟退休;考虑闲暇偏好的异质性,男性参保者更倾向于早退休,而女性参保者特别是女性较高收入群体更愿意延迟退休;厌恶风险的参保者更有可能选择早退休。建议尽早建立弹性退休年龄政策体系,增加劳动者的选择权和制度灵活性;引入精算调节因子构建养老金奖惩机制,完善养老保险待遇计发办法。 展开更多
关键词 延迟退休 养老金财富 option Value模型
下载PDF
基于IUV_5G Option3X架构网络规划与部署设计
3
作者 卢善勇 许景渊 《中国宽带》 2024年第1期1-3,共3页
本文基于IUV_5G Option3X架构,详细阐述了5G网络的规划与部署设计过程。首先介绍了5G NSA组网架构的背景和优势,然后深入探讨了IUV_5G全网部署与优化虚拟仿真平台的功能和应用。重点描述了核心网、无线网和承载网的部署过程,包括设备部... 本文基于IUV_5G Option3X架构,详细阐述了5G网络的规划与部署设计过程。首先介绍了5G NSA组网架构的背景和优势,然后深入探讨了IUV_5G全网部署与优化虚拟仿真平台的功能和应用。重点描述了核心网、无线网和承载网的部署过程,包括设备部署、数据配置和线路连接等具体步骤。通过业务验证确认了网络部署的成功,并对5G技术的未来发展进行了展望。 展开更多
关键词 5G网络 option3X架构 NSA组网 虚拟仿真平台 核心网
下载PDF
Research on Value Evaluation Method of Investment Project Based on Fuzzy Composite Real Options
4
作者 Huanyu Li 《Economics World》 2024年第1期24-34,共11页
Venture capital investments are characterized by high input,high yield,and high risk.Due to the complexity of the market environment,stage-by-stage investment is becoming increasingly important.Traditional evaluation ... Venture capital investments are characterized by high input,high yield,and high risk.Due to the complexity of the market environment,stage-by-stage investment is becoming increasingly important.Traditional evaluation methods like comparison,proportion,maturity,internal rate of return,scenario analysis,decision trees,and net present value cannot fully consider the uncertainty and stage characteristics of the project.The fuzzy real options method addresses this by combining real option theory,fuzzy number theory,and composite option theory to provide a more accurate and objective evaluation of Public-Private Partnership(PPP)projects.It effectively considers the interaction of options and the ambiguity of project parameters,making it a valuable tool for project evaluation in the context of venture capital investment. 展开更多
关键词 real option fuzzy method Geske composite option
下载PDF
基于互信息优化的Option-Critic算法
5
作者 栗军伟 刘全 徐亚鹏 《计算机科学》 CSCD 北大核心 2024年第2期252-258,共7页
时序抽象作为分层强化学习的重要研究内容,允许分层强化学习智能体在不同的时间尺度上学习策略,可以有效解决深度强化学习难以处理的稀疏奖励问题。如何端到端地学习到优秀的时序抽象策略一直是分层强化学习研究面临的挑战。Option-Crit... 时序抽象作为分层强化学习的重要研究内容,允许分层强化学习智能体在不同的时间尺度上学习策略,可以有效解决深度强化学习难以处理的稀疏奖励问题。如何端到端地学习到优秀的时序抽象策略一直是分层强化学习研究面临的挑战。Option-Critic(OC)框架在Option框架的基础上,通过策略梯度理论,可以有效解决此问题。然而,在策略学习过程中,OC框架会出现Option内部策略动作分布变得十分相似的退化问题。该退化问题影响了OC框架的实验性能,导致Option的可解释性变差。为了解决上述问题,引入互信息知识作为内部奖励,并提出基于互信息优化的Option-Critic算法(Option-Critic Algorithm with Mutual Information Optimization,MIOOC)。MIOOC算法结合了近端策略Option-Critic(Proximal Policy Option-Critic,PPOC)算法,可以保证下层策略的多样性。为了验证算法的有效性,把MIOOC算法和几种常见的强化学习方法在连续实验环境中进行对比实验。实验结果表明,MIOOC算法可以加快模型学习速度,实验性能更优,Option内部策略更有区分度。 展开更多
关键词 深度强化学习 时序抽象 分层强化学习 互信息 内部奖励 option多样性
下载PDF
重视血管co-option在肝癌治疗中的潜在机制及治疗靶点作用
6
作者 齐明皓 李景涛 翟博 《世界华人消化杂志》 CAS 2024年第11期827-834,共8页
肝细胞癌(hepatocellular carcinoma,HCC)是最常见的癌症之一.HCC起病隐匿,多数患者首次诊断时已丧失根治性手术的机会,系统性的抗肿瘤治疗成为中晚期HCC治疗的关键.其中抗肿瘤药物出现耐药性是HCC疗效不佳,影响HCC患者预后的重要原因之... 肝细胞癌(hepatocellular carcinoma,HCC)是最常见的癌症之一.HCC起病隐匿,多数患者首次诊断时已丧失根治性手术的机会,系统性的抗肿瘤治疗成为中晚期HCC治疗的关键.其中抗肿瘤药物出现耐药性是HCC疗效不佳,影响HCC患者预后的重要原因之一,如何改善HCC的治疗效果仍是现今研究的重点.尽管国内外对以新生血管生成为基础的抗肿瘤药物的研究不断深入,但对共用正常组织血管来满足肿瘤自身代谢需求的血管共选择(vascular co-option)模式研究较少,其对HCC的进展及抗肿瘤治疗的影响也未被人考虑在内.本文就血管co-option对HCC多种治疗方式的影响及相关机制进行概述,以期为改善HCC耐药奠定理论基础. 展开更多
关键词 肝癌 肿瘤耐药 血管co-option 新生血管生成 抗血管生成治疗 免疫治疗
下载PDF
Pricing Catastrophe Options with Credit Risk in a Regime-Switching Model
7
作者 XU Yajuan WANG Guojing 《应用概率统计》 CSCD 北大核心 2024年第4期572-587,共16页
In this paper,we consider the price of catastrophe options with credit risk in a regime-switching model.We assume that the macroeconomic states are described by a continuous-time Markov chain with a finite state space... In this paper,we consider the price of catastrophe options with credit risk in a regime-switching model.We assume that the macroeconomic states are described by a continuous-time Markov chain with a finite state space.By using the measure change technique,we derive the price expressions of catastrophe put options.Moreover,we conduct some numerical analysis to demonstrate how the parameters of the model affect the price of the catastrophe put option. 展开更多
关键词 PRICING catastrophe option credit risk REGIME-SWITCHING measure change
下载PDF
Modeling the Spatio-Temporal Dynamics of Local Context for a Contextualized Diffusion of Agroecological Intensification Options in Niger
8
作者 Nouhou Salifou Jangorzo Maud Loireau +3 位作者 Abou-Soufianou Sadda Ousmane Sami Mari Abdoul-Aziz Saïdou Hassane Bil-Assanou Issoufou 《International Journal of Geosciences》 CAS 2024年第3期270-301,共32页
Spatio-temporal variability and dynamics in Sahelian agro-pastoral zones make each local situation a special case. These specificities must be considered to guide the dissemination of agricultural options with a view ... Spatio-temporal variability and dynamics in Sahelian agro-pastoral zones make each local situation a special case. These specificities must be considered to guide the dissemination of agricultural options with a view to sustainable development. The territorial scale of municipalities is not sufficient for this necessary contextualization;the scale of the “village terroir” seems to be a better option. This is the hypothesis we put forward in the framework of the Global Collaboration for Resilient Food Systems program (CRFS), i.e. local context is spatially defined by village terroir. The study is based on data collected through participatory mapping and surveys in “village terroirs” in three regions of Niger (Maradi, Dosso and Tillabéri). Then the links between farm managers and their cultivated land, as well as the spatio-temporal dynamics of local context are analyzed. This study provides evidence of the existence and functional usefulness of the village terroir for farmers, their land management and their activities. It demonstrates the usefulness of contextualizing agricultural options at this scale. Their analysis elucidates the links between “terroirs village” and the specific functioning of the agrosocio-ecosystems acting on each of them, thus laying the systemic and geographical foundations for a model of the spatio- temporal dynamics of “village terroirs”. This initial work has opened up new perspectives in modeling and sustainable development. 展开更多
关键词 NIGER option by Context Local Condition Complex System Multiscale Conceptual Modeling
下载PDF
Toxic Currency Options in Poland as a Consequence of the 2008 Financial Crisis
9
作者 Kamil Liberadzki 《Chinese Business Review》 2015年第12期561-572,共12页
The paper is on toxic foreign exchange options problem which occurred in Poland just prior to and after the outbreak of the recent crisis. Especially Polish enterprises were severely stricken by transactions on fx and... The paper is on toxic foreign exchange options problem which occurred in Poland just prior to and after the outbreak of the recent crisis. Especially Polish enterprises were severely stricken by transactions on fx and interest rate derivatives contracted with their banks. Poland was the only EU country which did not precipitate into recession during the financial crisis beginning in 2008. However, the toxic fx and interest rate derivatives transmitted the shockwaves from global financial markets into Poland. Huge dimensions of losses resulted in conflicts between banks and their customers, who claimed just being cheated by the financial institutions. The article deeply researches into reasons for such developments on Polish fx over-the-counter derivatives market. As a case study, an authentic strategy has been presented. The contract was concluded between the construction company and one of the biggest commercial banks in Poland. Because the case study may be representative for many other cases, the analysis includes exact pricing of option strategy and therefore reveals inequality of the contract. The consequences of non-implementing the MiFID directive in the context of derivatives offering to non-financial customers were also touched in the paper. 展开更多
关键词 toxic foreign exchange options MiFID risk reversal foreign exchange portfolio hedging exotic options barrier options option strategies
下载PDF
基于TCP Options Address的客户端真实IP获取的设计与实现
10
作者 张会奇 《微型计算机》 2024年第12期37-39,共3页
在代理服务器场景下获取客户端的真实IP地址是非常常见的需求。但通常代理服务器会隐藏客户端的真实IP地址,这对真实IP地址的获取增加了困难。当前一些应用层协议,例如HTTP协议、Proxy protocol协议可以实现客户端真实IP地址的获取,但... 在代理服务器场景下获取客户端的真实IP地址是非常常见的需求。但通常代理服务器会隐藏客户端的真实IP地址,这对真实IP地址的获取增加了困难。当前一些应用层协议,例如HTTP协议、Proxy protocol协议可以实现客户端真实IP地址的获取,但都存在一些弊端,如都需要修改上游服务器的应用层程序。基于TCP Options Address,将数据包从内核态映射到用户态修改,不涉及上游服务器程序的变动,即可得到客户端真实IP地址。 展开更多
关键词 代理服务器 上游服务器 IP地址 TCP options Address 内核态 用户态
下载PDF
面向Option的k-聚类Subgoal发现算法 被引量:8
11
作者 王本年 高阳 +2 位作者 陈兆乾 谢俊元 陈世福 《计算机研究与发展》 EI CSCD 北大核心 2006年第5期851-855,共5页
在学习过程中自动发现有用的Subgoal并创建Option,对提高强化学习的学习性能有着重要意义.提出了一种基于k-聚类的Subgoal自动发现算法,该算法能通过对在线获取的少量路径数据进行聚类的方法抽取出Subgoal.实验表明,该算法能有效地发现... 在学习过程中自动发现有用的Subgoal并创建Option,对提高强化学习的学习性能有着重要意义.提出了一种基于k-聚类的Subgoal自动发现算法,该算法能通过对在线获取的少量路径数据进行聚类的方法抽取出Subgoal.实验表明,该算法能有效地发现所有符合要求的Subgoal,与Q-学习和基于多样性密度的强化学习算法相比,用该算法发现Subgoal并创建Option的强化学习算法能有效提高A-gent的学习速度. 展开更多
关键词 分层强化学习 option 子目标
下载PDF
The Utilization of Exotic Options in the Formation of Structured Products
12
作者 Martina Rusnakova Abduhamid M. Ahmed Younis 《Journal of Modern Accounting and Auditing》 2012年第12期1814-1822,共9页
This paper deals with the issue of investment certificate formation in the financial market. Investment certificate is a type of structured products, the value of which is derived from the value of an underlying asset... This paper deals with the issue of investment certificate formation in the financial market. Investment certificate is a type of structured products, the value of which is derived from the value of an underlying asset. The underlying asset is usually a share in a company, a basket of shares, or an entire index, etc.. It can be stated that for every estimated development of an asset (growth, fall, and stagnation) or for every attitude to risks (conservative or aggressive investors), there is a suitable kind of certificate. The main objective is to perform an analysis of the structured product--Austria/Germany Bond 3 and its guarantee certificate construction using digital-barrier options. The authors have found an alternative opportunity to the purchase of this certificate, i.e., investment in a bank deposit, together with a purchase of cash or nothing down and four-knock-out call options and a sale of cash or nothing down and four-knock-out put options. The authors prove that the alternative investment has the same profit profile as the certificate. The authors made this analysis with the objective to contribute to the intellectualization of investors. 展开更多
关键词 investment certificates vanilla options barrier options digital options profit profile
下载PDF
Fractal Nonstandard American Option Pricing Model
13
作者 YAN Yong-xin 《Chinese Business Review》 2013年第5期338-343,共6页
The empirical study shows that the return rate of the stock price has a long memory, which can be described by fractal Brown motion. The fact that fractal Brown motion does not have the characteristics of Markov makes... The empirical study shows that the return rate of the stock price has a long memory, which can be described by fractal Brown motion. The fact that fractal Brown motion does not have the characteristics of Markov makes the American option value depends on the price change path of the underlying asset. And the ordinary American option pricing model underestimates the American option value. In order to fully reflect the long memory of the underlying asset return rates, we propose fractal American option pricing model, fractal Bermuda option pricing model, and a fractal combination of American option pricing model. Fractal American option value is greater than the ordinary American option value. 展开更多
关键词 fractal American option fractal Bermudan option fractal combination American option
下载PDF
Early exercise European option and early termination American option pricing models
14
作者 YAN Yong-xin HU Yan-li 《Chinese Business Review》 2010年第11期21-25,共5页
The maximum relative error between continuous-time American option pricing model and binomial tree model is very small. In order to improve the European and American options in trade course, the thesis tried to build ... The maximum relative error between continuous-time American option pricing model and binomial tree model is very small. In order to improve the European and American options in trade course, the thesis tried to build early exercise European option and early termination American option pricing models. Firstly, the authors reviewed the characteristics of American option and European option, then there was compares between them. Base on continuous-time American option pricing model, this research analyzed the value of these options. 展开更多
关键词 option pricing early exercise European option pricing early termination American option pricing
下载PDF
基于可中断Option的在线分层强化学习方法 被引量:4
15
作者 朱斐 许志鹏 +2 位作者 刘全 伏玉琛 王辉 《通信学报》 EI CSCD 北大核心 2016年第6期65-74,共10页
针对大数据体量大的问题,在Macro-Q算法的基础上提出了一种在线更新的Macro-Q算法(MQIU),同时更新抽象动作的值函数和元动作的值函数,提高了数据样本的利用率。针对传统的马尔可夫过程模型和抽象动作均难于应对可变性,引入中断机制,提... 针对大数据体量大的问题,在Macro-Q算法的基础上提出了一种在线更新的Macro-Q算法(MQIU),同时更新抽象动作的值函数和元动作的值函数,提高了数据样本的利用率。针对传统的马尔可夫过程模型和抽象动作均难于应对可变性,引入中断机制,提出了一种可中断抽象动作的Macro-Q无模型学习算法(IMQ),能在动态环境下学习并改进控制策略。仿真结果验证了MQIU算法能加快算法收敛速度,进而能解决更大规模的问题,同时也验证了IMQ算法能够加快任务的求解,并保持学习性能的稳定性。 展开更多
关键词 大数据 强化学习 分层强化学习 option 在线学习
下载PDF
延迟退休对我国劳动者养老金收入的影响——基于Option Value模型的预测 被引量:26
16
作者 林熙 林义 《人口与经济》 CSSCI 北大核心 2015年第6期12-21,共10页
养老保险制度的精算公平性是延迟退休的经济基础。根据Option Value模型的预测结果,在当前养老保险计发办法下,延迟退休可能对男性劳动者和低收入劳动者造成明显的经济损失。而延长女性劳动者的退休年龄,也可能在特定假设条件下使其遭... 养老保险制度的精算公平性是延迟退休的经济基础。根据Option Value模型的预测结果,在当前养老保险计发办法下,延迟退休可能对男性劳动者和低收入劳动者造成明显的经济损失。而延长女性劳动者的退休年龄,也可能在特定假设条件下使其遭受经济损失。鉴于此,我国养老保险制度亟须调整,以做到精算公平,为渐进延迟退休年龄改革打下基础。 展开更多
关键词 延迟退休 养老保险 option Value模型
下载PDF
分层强化学习中的Option自动生成算法 被引量:5
17
作者 沈晶 顾国昌 刘海波 《计算机工程与应用》 CSCD 北大核心 2005年第34期4-6,15,共4页
分层强化学习中目前有Option、HAM和MAXQ三种主要方法,其自动分层问题均未得到有效解决,该文针对第一种方法,提出了Option自动生成算法,该算法以Agent在学习初始阶段探测到的状态空间为输入,采用人工免疫网络技术对其进行聚类,在聚类后... 分层强化学习中目前有Option、HAM和MAXQ三种主要方法,其自动分层问题均未得到有效解决,该文针对第一种方法,提出了Option自动生成算法,该算法以Agent在学习初始阶段探测到的状态空间为输入,采用人工免疫网络技术对其进行聚类,在聚类后的各状态子集上通过经验回放学习产生内部策略集,从而生成Option,仿真实验验证了该算法的有效性。 展开更多
关键词 分层强化学习 option 人工免疫网络 经验回放
下载PDF
基于多智能体的Option自动生成算法 被引量:2
18
作者 沈晶 顾国昌 刘海波 《智能系统学报》 2006年第1期84-87,共4页
目前分层强化学习中的任务自动分层都是采用基于单智能体的串行学习算法,为解决串行算法学习速度较慢的问题,以Sutton的Option分层强化学习方法为基础框架,提出了一种基于多智能体的Option自动生成算法,该算法由多智能体合作对状态空间... 目前分层强化学习中的任务自动分层都是采用基于单智能体的串行学习算法,为解决串行算法学习速度较慢的问题,以Sutton的Option分层强化学习方法为基础框架,提出了一种基于多智能体的Option自动生成算法,该算法由多智能体合作对状态空间进行并行探测并集中应用aiNet实现免疫聚类产生状态子空间,然后并行学习生成各子空间上的内部策略,最终生成Option.以二维有障碍栅格空间内2点间最短路径规划为任务背景给出了算法并进行了仿真实验和分析.结果表明,基于多智能体的Option自动生成算法速度明显快于基于单智能体的算法. 展开更多
关键词 分层强化学习 自动分层 多智能体系统 option AINET
下载PDF
基于并发Options的双边多议题协商模型优化 被引量:2
19
作者 彭志平 彭宏 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第9期95-100,共6页
针对双边多议题协商中的僵局问题,提出利用并发Options优化协商模型的方法.这种方法可在不降低双边协商效用的前提下,并行动态优化与僵局议题相关的多个议题的保留值.电子商务的实验结果表明:基于并发Options的协商模型优化方法是有效的... 针对双边多议题协商中的僵局问题,提出利用并发Options优化协商模型的方法.这种方法可在不降低双边协商效用的前提下,并行动态优化与僵局议题相关的多个议题的保留值.电子商务的实验结果表明:基于并发Options的协商模型优化方法是有效的;无论是学习速度,还是最佳策略的优化程度和泛化能力,该方法均明显优于基于标准Options和Q-学习的优化方法. 展开更多
关键词 协商模型 协商僵局 优化 并发options 强化学习
下载PDF
基于Option82技术的DHCP在大型网络中的实现 被引量:1
20
作者 肖阳 李阳 段辉良 《中南林业科技大学学报》 CAS CSCD 北大核心 2008年第5期140-142,共3页
目前大型网络中应用最多的就是动态主机配置协议(DHCP),它主要用来动态提供配置参数给因特网上的主机,一方面从DHCP服务器传送主机特定的协议配置参数到主机,同时自动分配网络地址给主机.针对DHCP技术结合O ption82机制在大型网络中的... 目前大型网络中应用最多的就是动态主机配置协议(DHCP),它主要用来动态提供配置参数给因特网上的主机,一方面从DHCP服务器传送主机特定的协议配置参数到主机,同时自动分配网络地址给主机.针对DHCP技术结合O ption82机制在大型网络中的应用做了详细的探讨. 展开更多
关键词 计算机网络 大型网络 DHCP option82
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部