Search results for "critic"

Hits ?▲	Authors	Title	Venue	Year	Link	Author keywords
112	Huaglory Tianfield, Ruwen Wang	Critic Systems - Towards Human-Computer Collaborative Problem Solving.	Artif. Intell. Rev.	2004	DBLP DOI BibTeX RDF	human-computer collaborative problem solving, knowledge-based system, expert system, critic system, human-computer collaboration
101	Thomas Hanselmann, Lyle Noakes, Anthony Zaknich	Continuous-Time Adaptive Critics.	IEEE Trans. Neural Networks	2007	DBLP DOI BibTeX RDF
88	Chuan-Kai Lin	Adaptive critic autopilot design of Bank-to-turn missiles using fuzzy basis function networks.	IEEE Trans. Syst. Man Cybern. Part B	2005	DBLP DOI BibTeX RDF
87	Shamama Anwar, K. Sridhar Patnaik	Actor Critic Learning: A Near Set Approach.	RSCTC	2008	DBLP DOI BibTeX RDF	ethogram, ethology, actor critic, rough sets, Adaptive learning, approximation space, near sets
75	Jan Peters 0001, Sethu Vijayakumar, Stefan Schaal	Natural Actor-Critic.	ECML	2005	DBLP DOI BibTeX RDF
63	Alok Kanti Deb, Jayadeva, Madan Gopal, Suresh Chandra 0001	SVM-Based Tree-Type Neural Networks as a Critic in Adaptive Critic Designs for Control.	IEEE Trans. Neural Networks	2007	DBLP DOI BibTeX RDF
63	Jooyoung Park, Jongho Kim, Daesung Kang	An RLS-Based Natural Actor-Critic Algorithm for Locomotion of a Two-Linked Robot Arm.	CIS (1)	2005	DBLP DOI BibTeX RDF
63	Ayose Falcón, Jared Stark, Alex Ramírez, Konrad Lai, Mateo Valero	Prophet/Critic Hybrid Branch Prediction.	ISCA	2004	DBLP DOI BibTeX RDF
63	Andrew Ireland, Alan Bundy	Extensions to a Generalization Critic for Inductive Proof.	CADE	1996	DBLP DOI BibTeX RDF
63	Barry G. Silverman	Building a Better Critic-Recent Empirical Results.	IEEE Expert	1992	DBLP DOI BibTeX RDF
63	Peter Shih, Brian C. Kaul, Sarangapani Jagannathan, James A. Drallmeier	Reinforcement-Learning-Based Dual-Control Methodology for Complex Nonlinear Discrete-Time Systems With Application to Spark Engine EGR Operation.	IEEE Trans. Neural Networks	2008	DBLP DOI BibTeX RDF
63	Pingan He 0002, Sarangapani Jagannathan	Reinforcement Learning Neural-Network-Based Controller for Nonlinear Discrete-Time Systems With Input Constraints.	IEEE Trans. Syst. Man Cybern. Part B	2007	DBLP DOI BibTeX RDF
62	Rafiuddin Syam, Keigo Watanabe, Kiyotaka Izumi	An Adaptive Actor-critic Algorithm with Multi-step Simulated Experiences for Controlling Nonholonomic Mobile Robots.	Soft Comput.	2007	DBLP DOI BibTeX RDF	Actor-critic algorithms, Multi-step prediction, Nonlinear predictive model, Simulated experience, Kinematic model, Nonholonomic mobile robot
62	Rafiuddin Syam, Keigo Watanabe, Kiyotaka Izumi	Adaptive actor-critic learning for the control of mobile robots by applying predictive models.	Soft Comput.	2005	DBLP DOI BibTeX RDF	Actor-critic algorithms, Tracking control problem, Predictive model, Temporal difference learning, Nonholonomic mobile robot
62	Andrés Pérez-Uribe	Using a Time-Delay Actor-Critic Neural Architecture with Dopamine-Like Reinforcement Signal for Learning in Autonomous Robots.	Emergent Neural Computational Architectures Based on Neuroscience	2001	DBLP DOI BibTeX RDF	Learning robots, actor-critic architecture, TD-learning, dopamine neurons, human teaching signals, reinforcement learning, time-delay neural networks
62	Cleidson R. B. de Souza, Jair S. Ferreira Jr., Kléder Miranda Gonçalves, Jacques Wainer	A Group Critic System for Object-Oriented Analysis and Design.	ASE	2000	DBLP DOI BibTeX RDF	group critic system, critiquing system, cooperative software development, design rationale
50	Norhayati Mohd. Ali, John G. Hosking, Jun Huh, John C. Grundy	Critic Authoring Templates for Specifying Domain-Specific Visual Language Tool Critics.	Australian Software Engineering Conference	2009	DBLP DOI BibTeX RDF
50	Francisco S. Melo, Manuel Lopes 0001	Fitted Natural Actor-Critic: A New Algorithm for Continuous State-Action MDPs.	ECML/PKDD (2)	2008	DBLP DOI BibTeX RDF
50	Efraín Franco Flores, Julio Waissman Vilanova, Jair García Lamont	Learning the Filling Policy of a Biodegradation Process by Fuzzy Actor-Critic Learning Methodology.	MICAI	2008	DBLP DOI BibTeX RDF
50	Dapeng Zhang, Aiguo Wu, Fuli Wang, Zhiling Lin	The Application of Adaptive Critic Design in the Nosiheptide Fermentation.	ISNN (1)	2007	DBLP DOI BibTeX RDF
50	James F. Peters	Granular Computing in Actor-Critic Learning.	FOCI	2007	DBLP DOI BibTeX RDF
50	Norhayati Mohd. Ali	A Generic Visual Critic Authoring Tool.	VL/HCC	2007	DBLP DOI BibTeX RDF
50	Zenon Hendzel	Adaptive Critic Neural Networks for Identification of Wheeled Mobile Robot.	ICAISC	2006	DBLP DOI BibTeX RDF
50	Toby Walsh	A Divergence Critic.	CADE	1994	DBLP DOI BibTeX RDF
50	James F. Peters, Christopher J. Henry, Sheela Ramanna	Reinforcement Learning in Swarms that Learn.	IAT	2005	DBLP DOI BibTeX RDF
49	Mohammed Shahid Abdulla, Shalabh Bhatnagar	Reinforcement Learning Based Algorithms for Average Cost Markov Decision Processes.	Discret. Event Dyn. Syst.	2007	DBLP DOI BibTeX RDF	Actor-critic algorithms, Two timescale stochastic approximation, Simultaneous perturbation stochastic approximation, Normalized Hadamard matrices, TD-learning, Reinforcement learning, Markov decision processes, Policy iteration
38	Patañjali S. Venkatacharya, Jonathan Kessler, Tami Hardeman, Ed Seiber, Bill Buxton	What makes a good design critic?: food design vs. product design criticism.	CHI Extended Abstracts	2010	DBLP DOI BibTeX RDF	culinary, user experience, metaphors, criticism, food
38	Derong Liu 0001, Hossein Javaherian, Olesia Kovalenko, Ting Huang	Adaptive Critic Learning Techniques for Engine Torque and Air-Fuel Ratio Control.	IEEE Trans. Syst. Man Cybern. Part B	2008	DBLP DOI BibTeX RDF
38	Jih-Wen Sheu, Wei-Song Lin	Designing Automatic Train Regulation for MRT system by adaptive critic method.	IJCNN	2008	DBLP DOI BibTeX RDF
38	Shingo Mabu, Yan Chen 0008, Kotaro Hirasawa, Jinglu Hu	Stock trading rules using genetic network programming with actor-critic.	IEEE Congress on Evolutionary Computation	2007	DBLP DOI BibTeX RDF
38	Huaguang Zhang, Yanhong Luo, Derong Liu 0001	A New Fuzzy Identification Method Based on Adaptive Critic Designs.	ISNN (1)	2006	DBLP DOI BibTeX RDF
38	Ayose Falcón, Jared Stark, Alex Ramírez, Konrad K. Lai, Mateo Valero	Better Branch Prediction Through Prophet/Critic Hybrids.	IEEE Micro	2005	DBLP DOI BibTeX RDF
38	Matti Aksela, Jorma Laaksonen	On Adaptive Confidences for Critic-Driven Classifier Combining.	ICAPR (1)	2005	DBLP DOI BibTeX RDF
38	Zhongwu Huang, S. N. Balakrishnan	Robust Adaptive Critic Based Neurocontrollers for Systems with Input Uncertainties.	IJCNN (3)	2000	DBLP DOI BibTeX RDF
38	Haifeng Chen, Guofei Jiang, Hui Zhang 0002, Kenji Yoshihira	Boosting the performance of computing systems through adaptive configuration tuning.	SAC	2009	DBLP DOI BibTeX RDF	configuration tuning, reinforcement learning, system management
38	Sarangapani Jagannathan, Pingan He 0002	Neural-Network-Based State Feedback Control of a Nonlinear Discrete-Time System in Nonstrict Feedback Form.	IEEE Trans. Neural Networks	2008	DBLP DOI BibTeX RDF
38	Jia Ma, Tao Yang 0011, Zeng-Guang Hou, Min Tan 0001, Derong Liu 0001	Dual Heuristic Programming Based Neurocontroller for Vibration Isolation Control.	ICNSC	2008	DBLP DOI BibTeX RDF
38	Peter Shih, Brian C. Kaul, Sarangapani Jagannathan, James A. Drallmeier	Near Optimal Output-Feedback Control of Nonlinear Discrete-time Systems in Nonstrict Feedback Form with Application to Engines.	IJCNN	2007	DBLP DOI BibTeX RDF
38	Richard L. Welch, Ganesh K. Venayagamoorthy	Optimal Control of a Photovoltaic Solar Energy System with Adaptive Critics.	IJCNN	2007	DBLP DOI BibTeX RDF
38	Hossein Javaherian, Derong Liu 0001, Olesia Kovalenko	Automotive Engine Torque and Air-Fuel Ratio Control Using Dual Heuristic Dynamic Programming.	IJCNN	2006	DBLP DOI BibTeX RDF
38	Junichiro Yoshimoto, Shin Ishii, Masa-aki Sato	On-Line EM Reinforcement Learning.	IJCNN (3)	2000	DBLP DOI BibTeX RDF
38	Rajit Gadh, Donna Herbert, Alexander Kott, Charles P. Kollar	Feature-Based Design for Manufacturability Critique in Concurrent Engineering.	MIT-JSME Workshop	1989	DBLP DOI BibTeX RDF
37	Chrisantha Fernando	Neuronal replicators solve the stability-plasticity dilemma.	GECCO	2010	DBLP DOI BibTeX RDF	actor-critic, neuronal replicator hypothesis, robotics, reinforcement learning
37	Dusko Katic, Aleksandar Rodic 0001, Miomir Vukobratovic	Hybrid Dynamic Control Algorithm for Humanoid Robots Based on Reinforcement Learning.	J. Intell. Robotic Syst.	2008	DBLP DOI BibTeX RDF	Biped locomotion, Integrated dynamic control, Actor-critic method, Reinforcement learning, Humanoid robots
37	Takashi Kuremoto, Masanao Obayashi, Kunikazu Kobayashi, Hirotaka Adachi, Kentaro Yoneda	A Neuro-fuzzy Learning System for Adaptive Swarm Behaviors Dealing with Continuous State Space.	ICIC (2)	2008	DBLP DOI BibTeX RDF	neuro-fuzzy net, swarm behavior, actor-critic algorithm, goal-exploration problem, multi-agent system, reinforcement learning
37	James F. Peters	Toward Approximate Adaptive Learning.	RSEISP	2007	DBLP DOI BibTeX RDF	Actor-critic, behaviour pattern, stopping time, perception, adaptive learning, approximation space
37	Yoichiro Matsuno, Tatsuya Yamazaki, Shin Ishii	A multi-agent reinforcement learning method for a partially-observable competitive game.	Agents	2001	DBLP DOI BibTeX RDF	actor-critic model, competitive game, reinforcement learning, multi-agent
25	Shalabh Bhatnagar, Vivek S. Borkar, Soumyajit Guin	Actor-Critic or Critic-Actor? A Tale of Two Time Scales.	IEEE Control. Syst. Lett.	2023	DBLP DOI BibTeX RDF
25	Prashansa Panda, Shalabh Bhatnagar	Finite Time Analysis of Constrained Actor Critic and Constrained Natural Actor Critic Algorithms.	CoRR	2023	DBLP DOI BibTeX RDF
25	Spilios Evmorfos, Athina P. Petropulu, H. Vincent Poor	Actor-Critic Methods for IRS Design in Correlated Channel Environments: A Closer Look Into the Neural Tangent Kernel of the Critic.	IEEE Trans. Signal Process.	2023	DBLP DOI BibTeX RDF
25	Swaminathan Gurumurthy, Zachary Manchester, J. Zico Kolter	Practical Critic Gradient based Actor Critic for On-Policy Reinforcement Learning.	L4DC	2023	DBLP BibTeX RDF
25	Xin Huo, Hamid Reza Karimi, Xudong Zhao 0001, Bohui Wang, Guangdeng Zong	Adaptive-Critic Design for Decentralized Event-Triggered Control of Constrained Nonlinear Interconnected Systems Within an Identifier-Critic Framework.	IEEE Trans. Cybern.	2022	DBLP DOI BibTeX RDF
25	Shalabh Bhatnagar, Vivek S. Borkar, Soumyajit Guin	Actor-Critic or Critic-Actor? A Tale of Two Time Scales.	CoRR	2022	DBLP DOI BibTeX RDF
25	Riazat Ryan, Ming Shao	Critic-over-Actor-Critic Modeling: Finding Optimal Strategy in ICU Environments.	IEEE Big Data	2022	DBLP DOI BibTeX RDF
25	Arushi Jain, Khimya Khetarpal, Doina Precup	Safe option-critic: learning safety in the option-critic architecture.	Knowl. Eng. Rev.	2021	DBLP DOI BibTeX RDF
25	Gengzhi Zhang, Liang Feng 0001, Yaqing Hou	Multi-task Actor-Critic with Knowledge Transfer via a Shared Critic.	ACML	2021	DBLP BibTeX RDF
25	Wei Zhou, Yiying Li, Yongxin Yang, Huaimin Wang, Timothy M. Hospedales	Online Meta-Critic Learning for Off-Policy Actor-Critic Methods.	CoRR	2020	DBLP BibTeX RDF
25	Aras Dargazany	Model-based actor-critic: GAN + DRL (actor-critic) => AGI.	CoRR	2020	DBLP BibTeX RDF
25	Jiajun Fan, He Ba, Xian Guo, Jianye Hao	Critic PI2: Master Continuous Planning via Policy Improvement with Path Integrals and Deep Actor-Critic Reinforcement Learning.	CoRR	2020	DBLP BibTeX RDF
25	Roumeissa Kitouni, Abderrahim Kitouni, Feng Jiang 0001	Generalized Critic Policy Optimization: A Model For Combining Advantage Estimates In Actor Critic Methods.	ICIP	2020	DBLP DOI BibTeX RDF
25	Yen-Chen Wu, Bo-Hsiang Tseng, Milica Gasic	Actor-Double-Critic: Incorporating Model-Based Critic for Task-Oriented Dialogue Systems.	EMNLP (Findings)	2020	DBLP DOI BibTeX RDF
25	Wei Zhou, Yiying Li, Yongxin Yang, Huaimin Wang, Timothy M. Hospedales	Online Meta-Critic Learning for Off-Policy Actor-Critic Methods.	NeurIPS	2020	DBLP BibTeX RDF
25	Norman L. Tasfi, Miriam A. M. Capretz	Noisy Importance Sampling Actor-Critic: An Off-Policy Actor-Critic With Experience Replay.	IJCNN	2020	DBLP DOI BibTeX RDF
25	Jonathan Lebensold, William L. Hamilton, Borja Balle, Doina Precup	Actor Critic with Differentially Private Critic.	CoRR	2019	DBLP BibTeX RDF
25	Ala'eddin Masadeh, Zhengdao Wang, Ahmed E. Kamal 0001	Selector-Actor-Critic and Tuner-Actor-Critic Algorithms for Reinforcement Learning.	WCSP	2019	DBLP DOI BibTeX RDF
25	Arushi Jain, Khimya Khetarpal, Doina Precup	Safe Option-Critic: Learning Safety in the Option-Critic Architecture.	CoRR	2018	DBLP BibTeX RDF
25	Jing Wang 0044, Ioannis Ch. Paschalidis	An Actor-Critic Algorithm With Second-Order Actor and Critic.	IEEE Trans. Autom. Control.	2017	DBLP DOI BibTeX RDF
25	Ian J. Livingston, Regan L. Mandryk, Kevin G. Stanley	Critic-proofing: how using critic reviews and game genres can refine heuristic evaluations.	Future Play	2010	DBLP DOI BibTeX RDF
25	Petia D. Koprinkova-Hristova, Günther Palm	Adaptive Critic Design with ESN Critic for Bioprocess Optimization.	ICANN (2)	2010	DBLP DOI BibTeX RDF
25	Swakshar Ray, Ganesh K. Venayagamoorthy, Balarko Chaudhuri, Rajat Majumder	Comparison of Adaptive Critic-Based and Classical Wide-Area Controllers for Power Systems.	IEEE Trans. Syst. Man Cybern. Part B	2008	DBLP DOI BibTeX RDF
25	Byungchan Kim, Byungduk Kang, Shinsuk Park, Sungchul Kang	Learning robot stiffness for contact tasks using the natural actor-critic.	ICRA	2008	DBLP DOI BibTeX RDF
25	Sertan Girgin, Philippe Preux	Basis Expansion in Natural Actor Critic Methods.	EWRL	2008	DBLP DOI BibTeX RDF
25	Zhao Sun, Xi Chen, Zhihai He	Adaptive Critic Design for Energy Minimization of Portable Video Communication Devices.	ICCCN	2008	DBLP DOI BibTeX RDF
25	Asma Al-Tamimi, Murad Abu-Khalaf, Frank L. Lewis	Adaptive Critic Designs for Discrete-Time Zero-Sum Games With Application to Hinfty Control.	IEEE Trans. Syst. Man Cybern. Part B	2007	DBLP DOI BibTeX RDF
25	Mohammad Ghavamzadeh, Yaakov Engel	Bayesian actor-critic algorithms.	ICML	2007	DBLP DOI BibTeX RDF
25	Tsuyoshi Ueno, Yutaka Nakamura, Takashi Takuma, Tomohiro Shibata, Koh Hosoda, Shin Ishii	Fast and Stable Learning of Quasi-Passive Dynamic Walking by an Unstable Biped Robot based on Off-Policy Natural Actor-Critic.	IROS	2006	DBLP DOI BibTeX RDF
25	Mehdi Khamassi, Louis-Emmanuel Martinet, Agnès Guillot	Combining Self-organizing Maps with Mixtures of Experts: Application to an Actor-Critic Model of Reinforcement Learning in the Basal Ganglia.	SAB	2006	DBLP DOI BibTeX RDF
25	Xin Xu 0001, Xuening Wang, Dewen Hu	Mobile Robot Path-Tracking Using an Adaptive Critic Learning PD Controller.	ISNN (2)	2004	DBLP DOI BibTeX RDF
25	Farzan Rashidi, Behzad Moshiri	Improvement of Low Frequency Oscillation Damping in Power Systems Via an Adaptive Critic Based NeuroFuzzy Controller.	KES	2004	DBLP DOI BibTeX RDF
25	George G. Lendaris, Larry Schultz, Thaddeus T. Shannon	Adaptive Critic Design for Intelligent Steering and Speed Control of a 2-Axle Vehicle.	IJCNN (3)	2000	DBLP DOI BibTeX RDF
25	Tomas Hrycej	An Estimate of the Number of Samples to Convergence for Critic Algorithms.	IJCNN (3)	2000	DBLP DOI BibTeX RDF
25	Donald C. Wunsch	The Cellular Simultaneous Recurrent Network Adaptive Critic Design for the Generalized Maze Problem Has a Simple Closed-Form Solution.	IJCNN (3)	2000	DBLP DOI BibTeX RDF
25	Louise A. Dennis, Alan Bundy, Ian Green	Using A Generalisation Critic to Find Bisimulations for Coinductive Proofs.	CADE	1997	DBLP DOI BibTeX RDF
25	Anthony G. Pipe, Terence C. Fogarty, Alan F. T. Winfield	Hybrid Adaptive Heuristic Critic Architectures for Learning in Mazes with Continuous Search Spaces.	PPSN	1994	DBLP DOI BibTeX RDF
25	Hassab Elgawi Osman	Architecture of behavior-based and robotics self-optimizing memory controller.	ICRA	2009	DBLP DOI BibTeX RDF
25	Abdeslam Boularias, Brahim Chaib-draa	Predictive representations for policy gradient in POMDPs.	ICML	2009	DBLP DOI BibTeX RDF
25	Qinmin Yang, Sarangapani Jagannathan	A Suite of Robust Controllers for the Manipulation of Microscale Objects.	IEEE Trans. Syst. Man Cybern. Part B	2008	DBLP DOI BibTeX RDF
25	Asma Al-Tamimi, Frank L. Lewis, Murad Abu-Khalaf	Discrete-Time Nonlinear HJB Solution Using Approximate Dynamic Programming: Convergence Proof.	IEEE Trans. Syst. Man Cybern. Part B	2008	DBLP DOI BibTeX RDF
25	Qinmin Yang, Jonathan Blake Vance, Sarangapani Jagannathan	Control of Nonaffine Nonlinear Discrete-Time Systems Using Reinforcement-Learning-Based Linearly Parameterized Neural Networks.	IEEE Trans. Syst. Man Cybern. Part B	2008	DBLP DOI BibTeX RDF
25	Silvia Ferrari, Mark Jensenius	A Constrained Optimization Approach to Preserving Prior Knowledge During Incremental Training.	IEEE Trans. Neural Networks	2008	DBLP DOI BibTeX RDF
25	Xiaohua Wang, S. N. Balakrishnan	Optimal controller synthesis of variable-time impulsive problems using single network adaptive critics.	IJCNN	2008	DBLP DOI BibTeX RDF
25	Takashi Kuremoto, Masanao Obayashi, Kunikazu Kobayashi, Hirotaka Adachi, Kentaro Yoneda	A reinforcement learning system for swarm behaviors.	IJCNN	2008	DBLP DOI BibTeX RDF
25	Wipawee Usaha, Javier A. Barria	Reinforcement Learning for Resource Allocation in LEO Satellite Networks.	IEEE Trans. Syst. Man Cybern. Part B	2007	DBLP DOI BibTeX RDF
25	Danil V. Prokhorov	Training Recurrent Neurocontrollers for Real-Time Applications.	IEEE Trans. Neural Networks	2007	DBLP DOI BibTeX RDF
25	Huai-Yu Wu, Chunhong Pan, Qing Yang 0002, Songde Ma	Consistent Correspondence between Arbitrary Manifold Surfaces.	ICCV	2007	DBLP DOI BibTeX RDF
25	Asma Al-Tamimi, Draguna L. Vrabie, Murad Abu-Khalaf, Frank L. Lewis	Model-free Approximate Dynamic Programming Schemes for Linear Systems.	IJCNN	2007	DBLP DOI BibTeX RDF
25	Daan Wierstra, Jürgen Schmidhuber	Policy Gradient Critics.	ECML	2007	DBLP DOI BibTeX RDF
25	Thaddeus T. Shannon	Qualitative Adaptive Critics.	IJCNN	2006	DBLP DOI BibTeX RDF
25	Chia-Feng Juang	Combination of online clustering and Q-value based GA for reinforcement fuzzy system design.	IEEE Trans. Fuzzy Syst.	2005	DBLP DOI BibTeX RDF
25	Nathan Denny, Michael M. Marefat	Exploiting similarity metrics and case-bases for knowledge sharing between case-based reasoners.	IRI	2005	DBLP DOI BibTeX RDF